Científicos evalúan la IA con el mismo método que los exámenes de ingreso a la universidad

Psicología
Científicos evalúan la IA con el mismo método que los exámenes de ingreso a la universidad

Para saber si un chat de inteligencia artificial miente, los investigadores han dejado de usar listas de verificación. Ahora evalúan el software como si fuera un estudiante rindiendo un examen de ingreso a la universidad.

Cuando un modelo de inteligencia artificial alucina, no solo comete un error; está fallando una prueba de probabilidad estadística. Para medir esto, los investigadores han recurrido a la psicometría. Esta es la misma rama de la psicología que se utiliza para diseñar exámenes de alto nivel como el SAT o el GRE. En lugar de cotejar las respuestas con una lista de verdades, emplean la teoría de respuesta al ítem.

Seguir Leyendo en la App
3 párrafos más · más un cuestionario de 3 preguntas
Abrir en la App

Obtener la experiencia completa

Descargar Conocimiento Diario