スマートフォンの「脳」の一部を使うだけで、高度な論理処理が可能に

技術
スマートフォンの「脳」の一部を使うだけで、高度な論理処理が可能に

次世代のモバイルAIは、デジタル構造のわずかな一部を選択的に使うことで、クラウド級の推論能力を実現しました。これにより、複雑な論理処理に必要なエネルギーを劇的に削減しています。

GoogleのGemma 4モデルは、「混合専門家(MoE)」という構造を採用しています。これにより、スマートフォン上で動作しながら、GPT-4のような巨大システムに匹敵する性能を発揮します。このシステムは、すべてのデータを巨大な神経回路網に通すのではなく、タスクを8つの「専門家」に振り分けます。全20億個のパラメータのうち、1トークンあたり3.75億個のみを活性化させる仕組みです。この戦略により計算負荷が75%削減され、iPhone 16のプロセッサで毎秒40トークンという高速処理を実現しました。

アプリで続きを読む
あと1段落 · プラス2問のクイズ
アプリで開く
Xでシェア WhatsApp

フル体験を楽しむ

毎日の知識をダウンロード