구글 AI 모드 1위, 그러나 드러난 AI의 한계...비판적 사고의 중요성 강조
구글 로고 (사진= 로이터 연합뉴스)
주요 인공지능(AI) 모델을 대상으로 한 검색 정확도 테스트에서 구글의 'AI 모드'가 가장 높은 점수를 받으며 1위를 차지했다. 오픈AI의 최신 모델인 GPT-5 기반 챗GPT는 2위에 머물렀다. 이번 테스트는 AI가 복잡한 질문에 얼마나 정확하고 신뢰성 높은 답을 제공하는지 평가하기 위해 진행됐다.
워싱턴포스트(WP)는 지난 27일(현지시간) 미국 공공·대학 도서관 사서들과 함께 총 9개의 주요 AI 검색 도구를 대상으로 심도 있는 테스트를 진행했다고 보도했다. 테스트 대상에는 구글의 AI 모드와 AI 오버뷰를 비롯해 챗GPT(GPT-5, GPT-4 터보), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트)이 포함됐다. 모든 도구는 7~8월 기준 무료 기본 버전으로만 평가가 이뤄졌다.
총 30개의 까다로운 질문을 던져 얻은 900건의 답변을 점수화한 결과, 구글 AI 모드가 100점 만점에 60.2점으로 1위를 차지했다. 이는 웹을 깊이 탐색해 여러 출처를 종합하는 AI 모드의 강점이 반영된 결과로 풀이된다. 2위는 55.1점을 받은 GPT-5 기반 챗GPT가 차지했고, 퍼플렉시티가 51.3점으로 그 뒤를 이었다. 반면, 일론 머스크의 그록3는 40.1점으로 8위에 그쳤으며, 메타 AI는 33.7점으로 가장 낮은 점수를 얻었다.
---
퀴즈·최신 사건 부문 강세, 분야별로는 희비 갈려
이번 테스트는 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지 분야에 걸쳐 진행됐다. 종합 점수와 별개로 각 부문에서는 AI 모델별로 희비가 엇갈렸다. 구글 AI 모드는 퀴즈와 최신 사건 부문에서 가장 정확하고 우수한 답변을 제공하며 강세를 보였다. 특히 최신 정보에 대한 검색 능력에서 다른 모델을 압도했다.
전문 출처를 검색하고 요약하는 능력에서는 빙 코파일럿이 가장 높은 점수를 받았다. 이미지 인식 부문에서는 퍼플렉시티가 최우수 모델로 꼽혔으며, 편향되지 않은 균형 잡힌 답변을 제공하는 데에는 GPT-4 터보가 가장 좋은 평가를 받았다. 한편, 전반적인 성능 개선을 보이며 2위를 차지한 GPT-5는 일부 영역에서는 오히려 GPT-4보다 낮은 점수를 받기도 해 모델별 편차를 드러냈다.
AI의 한계와 비판적 사고의 중요성
WP는 이번 테스트가 AI의 약점을 의도적으로 파고들었지만, 일상적인 질문에서도 AI가 여전히 제대로 답하지 못하는 경우가 많다는 사실이 드러났다고 분석했다. 특히 AI는 정보의 최신성이나 출처의 신뢰성을 판별하는 데 어려움을 겪는 것으로 나타났다. 때로는 잘못된 정보를 마치 사실인 양 자신 있게 내놓는 경향도 문제점으로 지적됐다.
WP는 "결국 AI가 내놓은 답변을 그대로 믿기보다는 사서처럼 출처를 확인하고, 최신성을 검증하며, 비판적으로 사고하는 능력이 여전히 중요하다는 교훈을 강조했다"고 전했다. AI는 인간의 사고를 돕는 도구일 뿐, 최종적인 판단은 여전히 인간의 몫이라는 의미다.
– 저작권자 ⓒ 국일일보, 무단전재•재배포 금지, AI 학습 및 활용 금지 –
이우창
기자
-
"세금 내기 전 성과급 잔치?" 삼성 노사 합의에 주주단체 전면 소송 예고
-
미중 회담 직후 등 돌린 중국, 러시아와 손잡고 '미국 때리기'
-
이재명 대통령, 가자지구 구호선 나포 이스라엘 강력 비판... "국제 규범 위반, 네타냐후 체포 영장 검토해야"
-
푸틴, 시진핑에 "우린 현대 국가 관계의 모범"…밀착 과시
-
안동서 마주한 한일 정상…‘신뢰 and 존중’의 세 번째 셔틀외교 가동
-
'전략적 안정' 악수 나누자마자…중국, 항모 띄워 태평양 영토화 속도전
-
서울시 “GTX-A 철근 누락, 이미 3차례 보고했다”… 국토부 ‘늑장’ 주장 정면 반박
-
'공포의 극지 크루즈' 한타바이러스 덮친 MV 혼디우스호의 운명은
-
국민 70%에 고유가 지원금 2차 지급…18일부터 접수 개시
-
美·러 정상 잇달아 품는 中…신냉전 흔들 ‘게임 체인저’ 노리나
-
"담합 신고하면 인생 역전"…공정위, 불공정거래 포상금 상한선 없애고 과징금 10% 준다
정부가 담합 등 불공정 거래 행위 내부 신고자에 대한 포상금 상한액을 없애고, 포상금 지급 요율을 과징금의 최대 10%로 일원화하는 등 파격적인 대우에 나선다. 공정거래위원회는 21일 이 같은 내용을 골자로 한 '공정거래법 등 위반행위 신고자에 대한 포상금 지급에 관한 규정' 개정안을 마련해 다음 달 10일까지 행정예고한다고 밝혔다. 은밀한 기업 간
-
'국정 동력' 노리는 민주 vs '정권 견제' 벼르는 국힘… 6·3 선거전 점화
여야는 6·3 지방선거 및 국회의원 재·보궐 선거 공식 선거운동 개막을 하루 앞둔 20일, 총력전 태세를 갖추고 승리를 다짐했다. 집권 여당인 더불어민주당은 이재명 정부 출범 후 첫 전국 단위 선거인 만큼 '내란 심판'과 '민생 경제'를 전면에 내세워 국정 동력 확보를 호소할 방침이다. 반면 국민의힘은 여당의 입법·행정 권력에 이은 지방 권력마저 독점할
-
인천시, 국내 최초 '양자기술 공공실증' 시동… 마약 감시 패러다임 바꾼다
인천시가 공공안전 분야에 양자기술을 접목한 '하수 내 마약류 감시 시스템' 구축에 나선다. 국내 최초로 시도되는 시민 체감형 양자기술 실증사업이다. 인천시는 '양자 기술 도입·전환(QX) 기반 시민체감 공공안전 실증사업'의 주관기업으로 (주)지큐티코리아를 선정하고 본격적인 실증에 착수했다고 밝혔다. 인천시와 인천테크노파크가 공동 추진하는 이번 사업은 지역
-
신분·소득 증빙 없이 생필품 지원… '그냥드림' 18일 본사업 전환
복잡한 신청이나 소득 증빙 없이 먹거리와 생필품을 지원하는 '그냥드림' 사업이 오는 18일부터 정식 본사업으로 전환된다. 보건복지부는 전국 158개 시군구 280개 사업장에서 그냥드림 본사업을 시행한다고 17일 밝혔다. 복지부는 본사업 시행에 이어 올해 말까지 전국 229개 모든 시군구에 사업장을 300곳 이상으로 확대 운영할 계획이다. 그냥드림은
-
선관위, ‘쪼개기 후원’ 등 정치자금법 위반 혐의자 2명 검찰 고발
중앙선거관리위원회(이하 선관위)는 올해 2분기 경상보조금으로 총 134억 4,300여만 원을 7개 정당에 지급했다고 15일 밝혔다. 더불어민주당(152석)이 59억 6,386만 원(44.49%)으로 가장 비중이 컸고, 국민의힘(106석)이 55억 8,473만 원(41.66%)을 지급받았다. 이어 조국혁신당 11억 5,372만 원(8.61%), 개혁신당
-
"한 번 쫓겨나도 또 온다"…중국인 '보트 밀입국'에 뚫리는 해상 국경
중국발 소형 보트를 이용한 해상 밀입국 시도가 잇따르자, 해양경찰청이 국경 감시망을 대폭 강화하고 집중 단속에 돌입했다. 30일 해양경찰청 자료에 따르면, 최근 3년간 발생한 해상 밀입국은 총 7건으로 집계됐다. 연도별 검거 현황은 2023년 3건(24명), 2024년 1건(1명)으로 잠시 주춤했으나, 올해 들어 다시 3건(16명)이 적발되는 등 총
-
소방청, 규제 혁파로 소방산업 육성... '2026 국제소방안전박람회'서 K-소방 저력 과시
김승룡 소방청장은 27일 유독가스와 폭발 위험이 높은 난접근성 재난에 대비해 무인 로봇 100대를 전국에 배치하는 등 첨단 대응체계로의 전환을 선언했다. 김 청장은 이날 세종시에서 열린 기자간담회에서 이 같은 내용의 첨단 장비 도입 및 중증·응급환자 이송체계 혁신 계획을 발표했다. 대형 유류 탱크 화재 등에 사용되는 대용량포 방사시스템을 호남과 수도권까지
-
특검 “증거인멸 시도” vs 권성동 “위법 수집 증거”… 28일 선고공판
통일교로부터 불법 정치자금 1억 원을 수수한 혐의로 기소된 국민의힘 권성동 의원에게 특검이 항소심에서도 징역 4년을 구형했다. 권 의원은 '대가성 없는 자금'이라며 무죄 주장을 굽히지 않았다. 민중기 특별검사팀은 21일 서울고법 형사2-1부(백승엽·황승태·김영현 고법판사) 심리로 열린 권 의원의 정치자금법 위반 사건 결심공판에서 재판부에 1심과 같은 징역
-
“우리 아이 생태 감수성 쑥쑥”... 인천, 맞춤형 생물다양성 교재 보급
인천시교육청(교육감 도성훈)이 유아기 생태환경 교육 내실화와 지역 기반의 유아교육·보육 혁신을 위해 국립생물자원관과 협력하여 ‘유아 생물다양성 교육자료 보급’을 추진한다. 이번 사업은 2026년 지역 기반형 유보 혁신지원 사업의 일환으로, 지역 전문기관의 교육자료를 보급해 유아들이 자연을 친숙하게 경험할 수 있는 교육 환경을 조성하기 위해 마련됐다. 지원
-
'중동 혼란·미중 회담' 틈새 노린 北… 신포 잠수함 기지서 무력시위
북한이 19일 오전 6시 10분경 함경남도 신포 일대에서 동해상으로 단거리 탄도미사일 수 발을 발사했다. 합동참모본부에 따르면 해당 미사일의 비행거리는 약 140km로 포착됐다. 한미 당국은 미사일의 제원을 정밀 분석 중이다. 발사 지점인 신포가 북한의 주요 잠수함 기지라는 점을 고려할 때 잠수함발사탄도미사일(SLBM)일 가능성이 제기된다. 신포는 북한이
국일일보 © 국일일보 All rights reserved.
국일일보의 모든 콘텐츠(기사 등)는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
RSS




