Geklonte Stimmen sind zu perfekt für den Menschen
Forensik-Experten können künstliche Stimmen entlarven, indem sie nach 'digitalen Fingerabdrücken' suchen. Diese entstehen, wenn Computer versuchen, das unregelmäßige Atmen des Menschen nachzuahmen.
Wenn ein Mensch spricht, ist seine Stimme eine chaotische Symphonie aus ermüdenden Muskeln, schwankendem Lungendruck und winzigem, unvorhersehbarem Zittern. KI-Stimmenmodelle hingegen sind oft zu präzise für ihr eigenes Wohl. Diese Systeme verarbeiten Sprache meist mit Abtastraten von 16 bis 24 Kilohertz und zerlegen den menschlichen Klang in digitale Bausteine.