인공지능이 통과하지 못한 인간의 기초 주의력 테스트
인간은 긴 목록에서도 방해 요소를 쉽게 무시하지만, 주요 AI 모델들은 단어를 읽는 대신 색상을 맞추는 과제에서 집중력을 잃고 실패합니다.
스트룹 검사는 단어의 의미 대신 글자의 색상을 말하게 하여 인지 조절 능력을 측정하는 심리학 실험입니다. 예를 들어 '빨강'이라는 단어가 파란색 잉크로 적혀 있을 때, 사람은 무의식적으로 단어를 읽으려는 습관을 억제해야 합니다. 인간은 이러한 혼란스러운 신호가 계속되어도 높은 정확도를 유지하지만, 최신 거대 언어 모델들은 작업량이 늘어날수록 성능이 급격히 떨어지는 모습을 보였습니다.
앱에서 계속 읽기
단락 2개 더 · 그리고 3문제 퀴즈