AIの能力をSATと同じ数学的手法で測定
チャットボットが嘘をついているか見抜くため、研究者は単純なチェックリストを捨て、AIを「大学入試に挑む受験生」のように評価し始めています。
AIモデルが「ハルシネーション(もっともらしい嘘)」を起こすとき、それは単なるミスではありません。統計的な確率テストに失敗しているのです。この現象を測定するため、研究者は「計量心理学」という分野に注目しました。これは、米国の大学進学適性試験(SAT)や大学院入学共通試験(GRE)の設計に使われる心理学の一種です。
アプリで続きを読む
あと3段落 · プラス3問のクイズ