苹果发布“Siri AI”:更流畅对话,谷歌AI驱动,今秋登场

苹果发布“Siri AI”:更流畅对话,谷歌AI驱动,今秋登场

苹果公司在2026年全球开发者大会(WWDC)上正式揭晓了其最新的人工智能成果——'Siri AI'。这一全新的语音助手并非简单升级,而是基于一个由谷歌生成式AI模型驱动的双层架构,旨在让Siri从'命令执行者'彻底转变为'对话伙伴'。

Siri AI的核心:双层模型与谷歌赋能

据苹果软件工程高级副总裁Craig Federighi介绍,Siri AI采用两层处理架构:第一层是设备端轻量级模型,负责处理日常简单请求(如设置闹钟、发送信息),确保响应速度与隐私保护;第二层则通过云端调用谷歌的Gemini系列模型(经过苹果定制微调),处理复杂的多轮对话、上下文理解和知识推理。这种设计既继承了苹果引以为傲的本地隐私计算传统,又借力谷歌在大型语言模型上的技术积累。

'我们相信,最好的AI助手是既聪明又尊重隐私的。Siri AI能在不牺牲安全性的前提下,带来前所未有的对话深度。'——Craig Federighi,WWDC 2026主题演讲

值得注意的是,这是苹果首次公开与谷歌在核心AI技术上的深度合作。此前有传言称苹果曾与OpenAI、Anthropic等公司洽谈,但最终选择了谷歌的模型作为云端底座。分析人士认为,这一方面是谷歌在TPU算力与模型能力上的优势使然,另一方面也反映了苹果对多模态能力(未来可处理图像、语音、视频)的长期规划。

功能革新:从'唤醒词'到'自然交谈'

在演示中,Siri AI展示了多项变革性功能:用户不再需要每次先说'嘿,Siri',而是可以连续对话,甚至中途打断并改变话题;当用户说'订一张周五去纽约的机票,呃,等等,改成芝加哥吧',Siri AI能理解这种修正并更新回复。此外,它还支持生成式摘要:用户问'今天有哪几封邮件需要回复?',Siri AI不仅会列出邮件,还能自动用自然语言总结每一封的重点。

更令人印象深刻的是'情境感知'能力。例如,当用户查看照片时问Siri:'这个人是谁?上次我们在哪见到的?',Siri AI会识别照片中的人物,并结合日历、通讯录等数据给出答案——这一切都在加密空间内完成,苹果承诺数据不上传至云端。

行业背景与编者按

苹果此举正值科技巨头纷纷加码AI语音助手的混战期。亚马逊的Alexa已整合大模型推出'Alexa+’,微软的Copilot全面融入Windows,谷歌也在Pixel设备上强化Google Assistant。相比之下,Siri长期因功能僵化、'弱智'而饱受诟病。此次 Apple 押注合作伙伴(而非像对手那样自研全栈模型),既是务实选择,也是一种新的策略博弈。

编者按: 苹果一直强调'隐私优先',但接入第三方云端模型不可避免地带来新的信任问题。谷歌模型是否会在苹果设备上收集用户数据?苹果与谷歌之间的数据协议细节尚未公开。此外,双层架构中本地模型的能力边界如何划定,将直接影响用户体验的流畅度。如果两套模型切换不够丝滑,反而可能导致比之前更糟的'反应分裂'。

推出时间与可用性

Siri AI将作为iOS 20、iPadOS 18、macOS 15以及watchOS 11的核心功能之一,于2026年秋季向用户推送。初期仅支持英语、中文、西班牙语和阿拉伯语,更多语言将在后续更新中加入。设备兼容性方面,苹果表示需要至少A16或M2以上芯片才能完全运行本地模型,这意味着iPhone 14 Pro及以上、iPad Air(M2)和MacBook(M2)系列将享受完整功能。

本文编译自Ars Technica