据Ars Technica报道,苹果正在积极探索将谷歌的Gemini大型语言模型(LLM)集成到iPhone中,以赋能全新升级的Siri。这一消息源于双方近期在AI领域的深度合作动向。Gemini作为谷歌目前最强大的多模态模型,其参数量庞大——即使是精简版本(如Gemini Nano)也需数十亿参数,而标准版本更达上万亿级别。要在iPhone有限的硬件资源(内存、算力、功耗)上运行如此规模的模型,苹果面临着前所未有的工程挑战。
为什么是Gemini?
苹果长期以来在AI领域采取“后发制人”策略,但面对ChatGPT、Google Assistant等对手的持续进化,Siri的短板愈发明显。选择Gemini而非自研大模型,一方面是因为谷歌在LLM上积累深厚,Gemini在理解和生成任务上表现优异;另一方面,苹果可能希望通过与谷歌合作快速补齐能力,同时保持对用户数据的控制权——将敏感查询本地处理,云端仅处理非隐私任务。这种混合架构在智能助手领域已成趋势,但Gemini的体积使得本地部署变得尤为困难。
“As Apple tries to shrink Gemini for the iPhone, a cloud component is probably inevitable.” —— Ryan Whitwam, Ars Technica
上述摘要在原文中一针见血地指出:苹果试图为iPhone瘦身Gemini,但云组件的引入几乎必然。这意味着Siri的响应可能不再完全离线,而是依赖网络连接来处理更复杂的请求。对于注重隐私的苹果而言,这需要在体验和隐私之间寻找平衡点——或许通过端侧模型处理日常指令(如设置闹钟、发送信息),而将高级推理、内容生成等任务交由云端。
端侧AI的现实与妥协
苹果在端侧AI部署上已有成功案例:A17 Pro芯片搭载的16核Neural Engine可达到每秒35万亿次操作,足够运行较小规模的神经网络。但Gemini的参数量远超现有移动端模型。以Google Pixel 8系列搭载的“Gemini Nano”为例,它只有1.8B参数,已能够实现通话摘要、智能回复等基础功能。而苹果的目标显然不止于此——它们希望Siri具备更强的上下文理解、多轮对话和跨App操作能力,这可能需要更大规模的模型。
行业分析指出,苹果可能采取“两级制”:iPhone本地运行自研的轻量级模型(如AppleLLM)负责日常任务;当检测到复杂请求时,自动切换到云端Gemini。这与微软Copilot的“本地+云端”模式异曲同工。但挑战在于延迟:网络请求需控制在数百毫秒内,否则用户会感到明显卡顿。苹果强大的生态整合能力或许能通过App Intents和系统级优化缓解这一问题。
对用户的影响与展望
如果方案成功,新Siri将拥有三大突破:一是回答更精准,能理解隐晦表达;二是具备创造力,可直接生成图像、文章或代码;三是深度整合第三方App,实现跨应用操作。但用户也需关注数据隐私:云端处理意味着用户查询会经由谷歌服务器(虽然苹果可能采用联邦学习或去标识化技术)。苹果预计将在2026年WWDC上展示这一新Siri,并于同年随iOS 26正式推出。
编者按:苹果与谷歌在AI上的合作看似“强强联合”,实则充满博弈。谷歌提供顶尖模型,但苹果则希望将用户留在自己的生态内。未来或许会出现更多类似“苹果牌Gemini”的定制版本,但最终用户体验才是决定成败的关键。对消费者来说,一个真正智能的Siri值得期待;但对整个行业而言,这标志着端侧AI竞争已进入“模型军备竞赛”阶段。
本文编译自Ars Technica
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接