구글 AI 모드 1위, 그러나 드러난 AI의 한계...비판적 사고의 중요성 강조
구글 로고 (사진= 로이터 연합뉴스)
주요 인공지능(AI) 모델을 대상으로 한 검색 정확도 테스트에서 구글의 'AI 모드'가 가장 높은 점수를 받으며 1위를 차지했다. 오픈AI의 최신 모델인 GPT-5 기반 챗GPT는 2위에 머물렀다. 이번 테스트는 AI가 복잡한 질문에 얼마나 정확하고 신뢰성 높은 답을 제공하는지 평가하기 위해 진행됐다.
워싱턴포스트(WP)는 지난 27일(현지시간) 미국 공공·대학 도서관 사서들과 함께 총 9개의 주요 AI 검색 도구를 대상으로 심도 있는 테스트를 진행했다고 보도했다. 테스트 대상에는 구글의 AI 모드와 AI 오버뷰를 비롯해 챗GPT(GPT-5, GPT-4 터보), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트)이 포함됐다. 모든 도구는 7~8월 기준 무료 기본 버전으로만 평가가 이뤄졌다.
총 30개의 까다로운 질문을 던져 얻은 900건의 답변을 점수화한 결과, 구글 AI 모드가 100점 만점에 60.2점으로 1위를 차지했다. 이는 웹을 깊이 탐색해 여러 출처를 종합하는 AI 모드의 강점이 반영된 결과로 풀이된다. 2위는 55.1점을 받은 GPT-5 기반 챗GPT가 차지했고, 퍼플렉시티가 51.3점으로 그 뒤를 이었다. 반면, 일론 머스크의 그록3는 40.1점으로 8위에 그쳤으며, 메타 AI는 33.7점으로 가장 낮은 점수를 얻었다.
---
퀴즈·최신 사건 부문 강세, 분야별로는 희비 갈려
이번 테스트는 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지 분야에 걸쳐 진행됐다. 종합 점수와 별개로 각 부문에서는 AI 모델별로 희비가 엇갈렸다. 구글 AI 모드는 퀴즈와 최신 사건 부문에서 가장 정확하고 우수한 답변을 제공하며 강세를 보였다. 특히 최신 정보에 대한 검색 능력에서 다른 모델을 압도했다.
전문 출처를 검색하고 요약하는 능력에서는 빙 코파일럿이 가장 높은 점수를 받았다. 이미지 인식 부문에서는 퍼플렉시티가 최우수 모델로 꼽혔으며, 편향되지 않은 균형 잡힌 답변을 제공하는 데에는 GPT-4 터보가 가장 좋은 평가를 받았다. 한편, 전반적인 성능 개선을 보이며 2위를 차지한 GPT-5는 일부 영역에서는 오히려 GPT-4보다 낮은 점수를 받기도 해 모델별 편차를 드러냈다.
AI의 한계와 비판적 사고의 중요성
WP는 이번 테스트가 AI의 약점을 의도적으로 파고들었지만, 일상적인 질문에서도 AI가 여전히 제대로 답하지 못하는 경우가 많다는 사실이 드러났다고 분석했다. 특히 AI는 정보의 최신성이나 출처의 신뢰성을 판별하는 데 어려움을 겪는 것으로 나타났다. 때로는 잘못된 정보를 마치 사실인 양 자신 있게 내놓는 경향도 문제점으로 지적됐다.
WP는 "결국 AI가 내놓은 답변을 그대로 믿기보다는 사서처럼 출처를 확인하고, 최신성을 검증하며, 비판적으로 사고하는 능력이 여전히 중요하다는 교훈을 강조했다"고 전했다. AI는 인간의 사고를 돕는 도구일 뿐, 최종적인 판단은 여전히 인간의 몫이라는 의미다.
– 저작권자 ⓒ 국일일보, 무단전재•재배포 금지, AI 학습 및 활용 금지 –
이우창
기자
-
대법원 판결도 헌재 심판대로… '소송 지옥' 우려 속 입법 강행
-
페제시키안 이란 대통령, 시위 진압 첫 사과... "국민 목소리 귀 기울일 것"
-
미 환경 정책 16년 전으로 회귀…글로벌 기업 ‘규제 혼선’ 비상
-
여야, ‘이재명 재판’ 정면충돌… ‘공소취소 국조’ vs ‘재판속개 촉구’
-
"이재명 정부 못 믿겠다는 美"... 국힘, 관세 압박·쿠팡 사태 총공세
-
‘다카이치 대승’에 허 찔린 베이징…중일 관계 긴장 고조냐 완화냐
-
미 핵잠수함 서호주 상시 주둔하나… ‘안보 요새’ vs ‘주권 침해’ 논란
-
‘특수통’ 추천한 민주당에 격노한 청와대… “대통령에 대한 배신인가”
-
“서울 한 평 3억, 말이 되나”… 이 대통령, 창원서 ‘수도권 집중’ 맹타
-
"안전하다더니" 우버의 배신... 美 배심원단, 성폭행 피해 여성 손 들어줘
-
‘하늘이법’ 법사위 문턱 넘었다…학교 사각지대 CCTV 설치 의무화
국회 법제사법위원회는 11일 전체회의를 열고 출입문과 복도 등 학교 내 안전 사각지대에 폐쇄회로(CC)TV 설치를 의무화하는 ‘초·중등교육법 개정안’, 이른바 ‘하늘이법’을 여야 합의로 처리했다. 개정안은 출입문, 복도, 계단 등 사고 위험이 높은 학교 안팎 주요 지점에 CCTV 설치를 의무화하는 것이 골자다. 지난해 2월 발생한 고(故) 김하늘 양 살해
-
대법원 "재판소원 도입은 위헌... 최고법원 권위 부정하는 4심제"
대법원이 더불어민주당의 재판소원 도입 시도에 대해 헌법 위배 및 사법 체계 혼란을 이유로 정면 반대하고 나섰다. "헌법 개정 없이는 도입이 불가능하며, 국가 경쟁력 약화와 국민에 대한 '희망고문'을 유발할 것"이라며 국회에 강력한 반대 의견을 전달했다. 10일 정치권에 따르면 대법원 법원행정처는 김기표 민주당 의원이 대표 발의한 헌법재판소법 개정안에 대한
-
법원, 특검 ‘별건 수사’에 잇단 제동… "수사 범위 일탈은 위헌적"
김건희 여사 관련 의혹을 수사한 민중기 특별검사팀이 기소한 사건들이 법원에서 잇따라 무죄 또는 공소기각 판결을 받으면서, 수사력의 한계를 드러냈다는 비판이 거세다. 법원이 공소제기 자체를 무효화한 사건에는 ‘무리한 수사’라는 평가가, 실체적 진실 증명에 실패해 무죄를 선고한 사건에는 ‘부실 수사’라는 지적이 따른다. 9일 법조계에 따르면 민 특검팀이
-
비트코인, 3년 만에 최대 낙폭… '트럼프 랠리' 끝나나
지난해 10월 역대 최고가를 경신했던 시가총액 1위 가상화폐 비트코인이 지난주 고점 대비 반 토막 수준으로 주저앉으며 극심한 변동성을 노출했다. 비트코인 가격은 지난달 31일(현지시간) 9개월 만에 8만 달러 선 아래로 떨어진 데 이어, 지난 5일에는 7만 달러 선마저 무너지며 15개월 만에 최저치를 기록했다. 특히 5일 하루에만 12% 이상 급락하며
-
경찰, ‘위증 혐의’ 로저스 쿠팡 대표 5시간째 조사… “수사 성실히 임할 것”
해롤드 로저스 쿠팡 한국 임시대표가 국회 청문회 위증 혐의로 6일 피의자 신분으로 경찰에 재출석했다. 서울경찰청 반부패수사대는 이날 오후 로저스 대표를 피의자 신분으로 소환해 국회증언감정법 위반 여부를 집중 조사했다. 경찰은 로저스 대표가 지난해 12월 국회 청문회에서 한 발언의 진위 및 위증의 고의성 여부를 집중적으로 추궁하고 있다. 당시 로저스 대표는
-
"통신과 배달의 결합" 대한민국단골-(주)바이럴솔루션, 전략적 업무제휴
▲2026년 2월 4일, (주)바이럴솔루션과 전국지역상권 활성화 협동조합이 '배달 플랫폼' 사업의 성공적인 활성화를 위해 통신 솔루션 지원 업무협약(MOU)을 체결하고 기념 촬영을 하고 있다. 대한민국단골주식회사(대표이사 정세균)와 (주)바이럴솔루션(상무 송재민)이 국내 통신 및 배달 플랫폼 시장의 새로운 도약과 경쟁력 강화를 위해 전략적 파트너십을
-
"아이부터 주민까지 치즈·버터 공급"... 북한, '스위스풍' 현대식 농장 공개
북한 김정은 국무위원장이 유제품 생산 기지인 평안북도 삼광축산농장 조업식에 참석해 농촌 발전의 '모범사례'라며 축산업의 세계적 수준 현대화를 강조했다. 조선중앙통신은 김 위원장이 지난 2일 열린 삼광축산농장 조업식에서 '역사적인 중요 연설'을 했다고 3일 보도했다. 김 위원장은 연설에서 "삼광축산농장은 낙후했던 운전군이 현대 농촌과 축산의 미래를 보여주는
-
코스피 5,000선 무너졌다… 금·은 폭락이 불러온 '검은 월요일'
연일 신고가를 경신하며 고공행진하던 코스피가 금·은 가격 폭락과 대규모 매도세에 밀려 5,000선 아래로 추락했다. 2일 코스피 지수는 오후 2시 40분 기준 전 거래일보다 4.59% 내린 4,984.48을 기록했다. 이날 지수는 전장 대비 101.74포인트(1.95%) 하락한 5,122.62로 개장했으나, 오후 1시 9분경에는 5.57% 급락한
-
"쿠팡 때문 아니다"... 청와대가 밝힌 트럼프 '관세 재점화'의 진짜 이유
청와대는 28일 도널드 트럼프 미국 대통령이 최근 언급한 '관세 재인상' 발언에 대해 "대미투자특별법의 국회 처리가 늦어지면서 합의사항 이행이 지연된 데 따른 불만으로 보인다"고 분석했다. 김용범 청와대 정책실장은 이날 기자간담회에서 "미국의 불만은 100% 국회 입법 지연에 있다고 본다"며 이같이 밝혔다. 미국 측도 법 심의 선행 필요성을 인지하고
-
한국 군사력 3년 연속 세계 5위… ‘글로벌 톱 5’ 입지 굳혔다
한국의 핵 전력을 제외한 종합 군사력이 미국, 러시아, 중국, 인도에 이어 3년 연속 세계 5위를 유지했다. 27일 군사력 평가기관 글로벌파이어파워(GFP)가 발표한 ‘2026 군사력 랭킹’에 따르면, 한국은 조사 대상 145개국 가운데 0.1642점을 기록하며 전체 5위에 올랐다. 한국의 GFP 군사력 순위는 2013년 9위, 2014년 7위,
국일일보 © 국일일보 All rights reserved.
국일일보의 모든 콘텐츠(기사 등)는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
RSS




