구글 AI 모드 1위, 그러나 드러난 AI의 한계...비판적 사고의 중요성 강조
구글 로고 (사진= 로이터 연합뉴스)
주요 인공지능(AI) 모델을 대상으로 한 검색 정확도 테스트에서 구글의 'AI 모드'가 가장 높은 점수를 받으며 1위를 차지했다. 오픈AI의 최신 모델인 GPT-5 기반 챗GPT는 2위에 머물렀다. 이번 테스트는 AI가 복잡한 질문에 얼마나 정확하고 신뢰성 높은 답을 제공하는지 평가하기 위해 진행됐다.
워싱턴포스트(WP)는 지난 27일(현지시간) 미국 공공·대학 도서관 사서들과 함께 총 9개의 주요 AI 검색 도구를 대상으로 심도 있는 테스트를 진행했다고 보도했다. 테스트 대상에는 구글의 AI 모드와 AI 오버뷰를 비롯해 챗GPT(GPT-5, GPT-4 터보), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트)이 포함됐다. 모든 도구는 7~8월 기준 무료 기본 버전으로만 평가가 이뤄졌다.
총 30개의 까다로운 질문을 던져 얻은 900건의 답변을 점수화한 결과, 구글 AI 모드가 100점 만점에 60.2점으로 1위를 차지했다. 이는 웹을 깊이 탐색해 여러 출처를 종합하는 AI 모드의 강점이 반영된 결과로 풀이된다. 2위는 55.1점을 받은 GPT-5 기반 챗GPT가 차지했고, 퍼플렉시티가 51.3점으로 그 뒤를 이었다. 반면, 일론 머스크의 그록3는 40.1점으로 8위에 그쳤으며, 메타 AI는 33.7점으로 가장 낮은 점수를 얻었다.
---
퀴즈·최신 사건 부문 강세, 분야별로는 희비 갈려
이번 테스트는 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지 분야에 걸쳐 진행됐다. 종합 점수와 별개로 각 부문에서는 AI 모델별로 희비가 엇갈렸다. 구글 AI 모드는 퀴즈와 최신 사건 부문에서 가장 정확하고 우수한 답변을 제공하며 강세를 보였다. 특히 최신 정보에 대한 검색 능력에서 다른 모델을 압도했다.
전문 출처를 검색하고 요약하는 능력에서는 빙 코파일럿이 가장 높은 점수를 받았다. 이미지 인식 부문에서는 퍼플렉시티가 최우수 모델로 꼽혔으며, 편향되지 않은 균형 잡힌 답변을 제공하는 데에는 GPT-4 터보가 가장 좋은 평가를 받았다. 한편, 전반적인 성능 개선을 보이며 2위를 차지한 GPT-5는 일부 영역에서는 오히려 GPT-4보다 낮은 점수를 받기도 해 모델별 편차를 드러냈다.
AI의 한계와 비판적 사고의 중요성
WP는 이번 테스트가 AI의 약점을 의도적으로 파고들었지만, 일상적인 질문에서도 AI가 여전히 제대로 답하지 못하는 경우가 많다는 사실이 드러났다고 분석했다. 특히 AI는 정보의 최신성이나 출처의 신뢰성을 판별하는 데 어려움을 겪는 것으로 나타났다. 때로는 잘못된 정보를 마치 사실인 양 자신 있게 내놓는 경향도 문제점으로 지적됐다.
WP는 "결국 AI가 내놓은 답변을 그대로 믿기보다는 사서처럼 출처를 확인하고, 최신성을 검증하며, 비판적으로 사고하는 능력이 여전히 중요하다는 교훈을 강조했다"고 전했다. AI는 인간의 사고를 돕는 도구일 뿐, 최종적인 판단은 여전히 인간의 몫이라는 의미다.
– 저작권자 ⓒ 국일일보, 무단전재•재배포 금지, AI 학습 및 활용 금지 –
이우창
기자
-
라면·과자부터 택시비까지…정부, 중동 사태발 전 품목 물가 감시
-
왕이, IAEA 사무총장 면담 "중동 핵시설 타격 시 파멸적 결과 초래"
-
밴스 카드 꺼낸 미국, 불신 늪 빠진 이란… 운명의 ‘48시간’ 카운트다운
-
재판소원 첫 관문은 '바늘구멍'... 헌재, 1호 사전심사 26건 전원 각하
-
일본 고교생, 내년부터 ‘독도 왜곡’ 교과서로 배운다
-
김민석 총리 "북한 강경 자세에도 평화 기조 유지... 전작권 전환 논의 중"
-
"석기시대로 돌아갈 판" 트럼프 위협에 이란 시민들 '생존 위기' 절규
-
25조 원 투입해 중동 쇼크 차단… 정부, 공급망 안정 및 수급 관리 총력
-
프라하에 울려 퍼진 20만 명의 외침 “민주주의를 지키자”
-
트럼프의 호르무즈 안보 고지서... 다카이치, 109조 투자로 응수
-
대한민국단골, 구로 사옥 이전 완료… “지역 경제 활성화의 주역 될 것”
25일 서울 구로디지털단지 신사옥에서 열린 대한민국단골 주식회사 개소식에서 관계자들이 성공적인 사업 추진과 디지털 경제 생태계 구축을 다짐하며 파이팅을 외치고 있다. 배경 화면에는 회사의 핵심 성장 동력인 UPC 코인 생태계 비전이 제시되고 있다. 사진=오태성 대한민국단골 주식회사가 지난 3월 18일 서울 구로디지털단지로 사옥 이전을 완료하고, 25일
-
"평양 오는 광경 보고 싶지 않다"… 김여정, 日 총리 방북 가능성 차단
김여정 북한 노동당 중앙위원회 부장은 23일 다카이치 사나에 일본 총리가 북일정상회담 추진 의사를 밝힌 것과 관련해 "일본이 원한다고 하여 실현되는 문제가 아니다"라고 밝혔다. 김 부장은 이날 조선중앙통신을 통해 발표한 담화에서 "일본 수상이 우리가 인정하지도 않는 저들의 일방적 의제를 해결해보겠다는 것이라면 우리 국가지도부는 만날 의향도, 마주 앉을
-
"전산 기록보다 더 일했다" 44.8%... 이름뿐인 전공의 보호 수련 제도
대한전공의협의회(이하 대전협)는 전국 전공의 1,755명을 대상으로 진행한 실태조사 결과를 22일 공개했다. 조사 결과에 따르면 전공의들의 열악한 근무 환경과 인권 침해 실태가 여전히 심각한 수준인 것으로 드러났다. 근무 시간 및 형태 실태 전체 응답자의 주당 평균 실제 근무 시간은 70.5시간으로 집계됐다. 특히 응답자의 44.8%는 전산상 기록된
-
곽상도 ‘50억 뇌물’ 항소심 내달 재개… 21개월 멈췄던 ‘50억 클럽’ 시계 다시 돈다
대장동 민간업자 김만배 씨로부터 뇌물 50억 원을 수수한 혐의로 기소됐으나 1심에서 무죄를 선고받은 곽상도 전 국민의힘 의원의 항소심 재판이 1년 9개월 만에 다시 열린다. 18일 법조계에 따르면 서울고법 형사3부(재판장 이승한)는 특정범죄 가중처벌법상 뇌물 등 혐의로 기소된 곽 전 의원의 항소심 속행공판 기일을 내달 14일로 지정했다. 이 사건은
-
조희대 대법원장·지귀연 판사 '법왜곡죄' 수사, 서울청 반부패수사대 배당
조희대 대법원장과 지귀연 부장판사의 ‘법왜곡죄’ 피고발 사건을 서울경찰청 광역수사단이 맡게 됐다. 17일 경찰에 따르면, 서울경찰청은 지 부장판사와 조 대법원장에 대한 법왜곡죄 사건을 이날 광역수사단 산하 반부패수사대에 배당했다. 이병철 변호사는 지 부장판사가 지난해 3월 윤석열 전 대통령 관련 재판 과정에서 구속기간을 ‘날’ 단위로 계산해야 할 법적
-
판결 불복 ‘법왜곡죄’ 고소전 확산… 판사·검사 타깃 됐다
최근 시행된 ‘법왜곡죄’를 근거로 판결이나 수사 결과에 승복하지 않고 판사, 특별검사, 고위공직자범죄수사처(공수처)장 등을 고소·고발하는 사례가 잇따르고 있다. 법왜곡죄 도입 당시부터 제기됐던 ‘무분별한 고소·고발에 따른 사법권 위축’ 우려가 현실화하고 있다는 지적이 나온다. 16일 법조계에 따르면, 스마트솔루션즈(전 에디슨EV) 주주연대 대표 A씨는
-
군 수송기 ‘시그너스’의 사투... 중동 사선 넘은 211명 성남 안착
미국·이스라엘과 이란 간 군사적 긴장으로 중동에 고립됐던 우리 국민을 군 수송기로 무사 귀환시킨 ‘사막의 빛’ 작전과 관련, 이재명 대통령이 15일 관계 부처와 군의 노고를 치하했다. 이 대통령은 이날 오후 SNS를 통해 "중동 정세로 고립됐던 우리 국민 204명이 무사히 귀국했다"며 "어려운 여건 속에서도 작전 성공을 위해 밤낮없이 헌신한 모든 관계자
-
법원 판결 뒤집는 ‘재판소원’ 봇물… 이틀 새 36건 몰렸다
법원 판결을 헌법재판소가 다시 심사하는 '재판소원' 제도 시행 이후 이틀 동안 36건의 심판 청구가 접수되며 사법 체계의 근간을 흔드는 중대한 변화가 본격화됐다는 평가가 나온다. 13일 헌법재판소에 따르면 지난 12일 0시부터 이날 오후 6시까지 전자접수 23건, 방문접수 5건, 우편접수 8건 등 총 36건의 재판소원 심판 청구가 제기됐다. 시행 첫날인
-
“검찰과 거래라니” 분노한 민주당…‘김어준 유튜브’발 의혹에 ‘칼’ 뽑았다
더불어민주당이 김어준 씨의 유튜브 채널을 통해 확산된 이른바 ‘공소취소 거래설’에 대해 고발 등 법적 대응을 포함한 강경 대응 방침을 세웠다. 당내 지도부의 미온적 대응에 대한 비판과 국민의힘의 특검 공세가 맞물리자, 사실무근의 의혹이 확산되는 것을 조기에 차단하고 내부 기강을 바로잡겠다는 의지로 풀이된다. 정청래 대표는 12일 오후 열린 의원총회에서
-
임해규 "정근식표 AI 교육은 영혼 없는 기술만능주의... '인간지능'이 먼저"
임해규 서울시 교육감 예비 후보가 서울시교육청이 추진 중인 인공지능(AI) 교육 정책을 '본질을 잃은 기술 만능주의'라고 규정하며 강도
국일일보 © 국일일보 All rights reserved.
국일일보의 모든 콘텐츠(기사 등)는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
RSS




