智能手机现可仅调用部分数字大脑处理复杂逻辑

技术 2026年4月6日 12:02

新一代移动人工智能通过选择性地调用一小部分数字架构，实现了云端级别的推理能力，大幅降低了处理复杂逻辑所需的能耗。

谷歌的 Gemma 2 模型在智能手机上本地运行，性能却能媲美 GPT-4 等大型系统。这主要归功于其采用的'混合专家'（MoE）架构。该系统不再让每条数据都经过整个神经网络，而是将任务分配给 8 个专门的'专家'。在处理每个字词（token）时，它仅从 20 亿个总参数中激活 3.75 亿个。这种策略将计算需求降低了 75%，使 iPhone 16 的神经处理单元能保持每秒 40 个字词的处理速度。

在应用中继续阅读

还有1个段落 · 再加2题测验

在应用中打开

分享到X WhatsApp

智能手机现可仅调用部分数字大脑处理复杂逻辑

相关事实

下载每日知识