苹果欲将巨型Gemini模型塞进iPhone，新Siri蓄势待发

2026年5月29日 362 约4分钟 Ars Technica

苹果 Gemini Siri AI助手端侧模型

据Ars Technica报道，苹果正在积极探索将谷歌的Gemini大型语言模型（LLM）集成到iPhone中，以赋能全新升级的Siri。这一消息源于双方近期在AI领域的深度合作动向。Gemini作为谷歌目前最强大的多模态模型，其参数量庞大——即使是精简版本（如Gemini Nano）也需数十亿参数，而标准版本更达上万亿级别。要在iPhone有限的硬件资源（内存、算力、功耗）上运行如此规模的模型，苹果面临着前所未有的工程挑战。

为什么是Gemini？

苹果长期以来在AI领域采取“后发制人”策略，但面对ChatGPT、Google Assistant等对手的持续进化，Siri的短板愈发明显。选择Gemini而非自研大模型，一方面是因为谷歌在LLM上积累深厚，Gemini在理解和生成任务上表现优异；另一方面，苹果可能希望通过与谷歌合作快速补齐能力，同时保持对用户数据的控制权——将敏感查询本地处理，云端仅处理非隐私任务。这种混合架构在智能助手领域已成趋势，但Gemini的体积使得本地部署变得尤为困难。

“As Apple tries to shrink Gemini for the iPhone, a cloud component is probably inevitable.” —— Ryan Whitwam, Ars Technica

上述摘要在原文中一针见血地指出：苹果试图为iPhone瘦身Gemini，但云组件的引入几乎必然。这意味着Siri的响应可能不再完全离线，而是依赖网络连接来处理更复杂的请求。对于注重隐私的苹果而言，这需要在体验和隐私之间寻找平衡点——或许通过端侧模型处理日常指令（如设置闹钟、发送信息），而将高级推理、内容生成等任务交由云端。

端侧AI的现实与妥协

苹果在端侧AI部署上已有成功案例：A17 Pro芯片搭载的16核Neural Engine可达到每秒35万亿次操作，足够运行较小规模的神经网络。但Gemini的参数量远超现有移动端模型。以Google Pixel 8系列搭载的“Gemini Nano”为例，它只有1.8B参数，已能够实现通话摘要、智能回复等基础功能。而苹果的目标显然不止于此——它们希望Siri具备更强的上下文理解、多轮对话和跨App操作能力，这可能需要更大规模的模型。

行业分析指出，苹果可能采取“两级制”：iPhone本地运行自研的轻量级模型（如AppleLLM）负责日常任务；当检测到复杂请求时，自动切换到云端Gemini。这与微软Copilot的“本地+云端”模式异曲同工。但挑战在于延迟：网络请求需控制在数百毫秒内，否则用户会感到明显卡顿。苹果强大的生态整合能力或许能通过App Intents和系统级优化缓解这一问题。

对用户的影响与展望

如果方案成功，新Siri将拥有三大突破：一是回答更精准，能理解隐晦表达；二是具备创造力，可直接生成图像、文章或代码；三是深度整合第三方App，实现跨应用操作。但用户也需关注数据隐私：云端处理意味着用户查询会经由谷歌服务器（虽然苹果可能采用联邦学习或去标识化技术）。苹果预计将在2026年WWDC上展示这一新Siri，并于同年随iOS 26正式推出。

编者按：苹果与谷歌在AI上的合作看似“强强联合”，实则充满博弈。谷歌提供顶尖模型，但苹果则希望将用户留在自己的生态内。未来或许会出现更多类似“苹果牌Gemini”的定制版本，但最终用户体验才是决定成败的关键。对消费者来说，一个真正智能的Siri值得期待；但对整个行业而言，这标志着端侧AI竞争已进入“模型军备竞赛”阶段。

本文编译自Ars Technica

苹果欲将巨型Gemini模型塞进iPhone，新Siri蓄势待发

为什么是Gemini？

端侧AI的现实与妥协

对用户的影响与展望

相关文章