Smartphones verarbeiten komplexe Logik heute mit nur einem Bruchteil ihres digitalen Gehirns
Die neueste Generation mobiler KI erreicht Cloud-Niveau, indem sie nur kleine Teile ihrer Architektur selektiv nutzt. Das senkt den Energiebedarf für komplexe Logik drastisch.
Googles Modell Gemma 4 erreicht die Leistung riesiger Systeme wie GPT-4, läuft aber lokal auf einem Smartphone. Dies gelingt durch eine 'Mixture-of-Experts'-Architektur (MoE). Das System leitet Aufgaben gezielt an acht spezialisierte 'Experten' weiter, anstatt jedes Datenbit durch das gesamte neuronale Netz zu jagen. Pro Token werden so nur 375 Millionen der insgesamt 2 Milliarden Parameter aktiviert.