Bilim insanları yapay zekayı üniversite sınavı mantığıyla puanlıyor
Araştırmacılar, bir sohbet botunun yalan söyleyip söylemediğini anlamak için basit kontrol listelerini bırakıp yazılıma zorlu bir üniversite sınavına giren bir öğrenci gibi yaklaşıyor.
Bir yapay zeka modeli yanlış bilgi ürettiğinde, bu sadece basit bir hata değildir. Bu durum, aslında modelin bir istatistiksel olasılık testinde başarısız olduğu anlamına gelir. Araştırmacılar bu durumu ölçmek için SAT ve GRE gibi sınavların tasarımında kullanılan psikometri biliminden yararlanıyor.