智能手机现可仅调用部分数字大脑处理复杂逻辑

技术
智能手机现可仅调用部分数字大脑处理复杂逻辑

新一代移动人工智能通过选择性地调用一小部分数字架构,实现了云端级别的推理能力,大幅降低了处理复杂逻辑所需的能耗。

谷歌的 Gemma 2 模型在智能手机上本地运行,性能却能媲美 GPT-4 等大型系统。这主要归功于其采用的'混合专家'(MoE)架构。该系统不再让每条数据都经过整个神经网络,而是将任务分配给 8 个专门的'专家'。在处理每个字词(token)时,它仅从 20 亿个总参数中激活 3.75 亿个。这种策略将计算需求降低了 75%,使 iPhone 16 的神经处理单元能保持每秒 40 个字词的处理速度。

在应用中继续阅读
还有1个段落 · 再加2题测验
在应用中打开

获得完整体验

下载每日知识