KI-Modelle halluzinieren bei undeutlicher Sprache seltener
Künstliche Intelligenz erfindet oft Fakten, wenn es zu ruhig ist. Ein wenig Hintergrundrauschen zwingt das System jedoch dazu, sich auf das tatsächlich Gesagte zu konzentrieren.
Wenn ein Sprecher nuschelt oder die Umgebung laut wird, verstehen Menschen oft kaum ein Wort. Doch die neuesten Synthese-Algorithmen von Google werden unter diesen Bedingungen sogar zuverlässiger. Die klassische Spracherkennung setzt eigentlich auf Stille und Klarheit als Goldstandard. In solch idealen Umgebungen analysieren KI-Modelle Pausen jedoch oft zu stark und 'halluzinieren' Details hinzu, die nie gesagt wurden.
Es gibt mehr zu lesen — öffne die App, um weiterzulesen.