谷歌押注Gemini，重塑智能音箱新形态

2026年6月18日 22 约3分钟 TechCrunch

谷歌 Gemini 智能音箱生成式AI 智能家居

在智能音箱市场日渐疲软的当下，谷歌选择了一条出人意料的路径：用生成式AI彻底改造这一品类。6月18日，谷歌正式发布售价99.99美元的新款Google Home Speaker，其最大亮点在于用Gemini驱动的自然对话交互，取代了传统Google Assistant时代基于关键词的命令式体验。

从“命令”到“对话”：交互范式的根本转变

过去十年，智能音箱用户早已习惯了“Hey Google，打开客厅灯”或“Alexa，播放新闻”这类固定句式。这种交互方式虽然高效，却缺乏人性化——用户必须记住特定指令，无法像与真人交谈那样自由表达。谷歌新一代Home Speaker彻底打破了这一限制：它基于Gemini大模型，能理解上下文模糊的请求。

你不再需要说‘设置明早7点的闹钟’，只需告诉它‘我明天需要早起开会，帮我安排一下’，音箱便会根据日程、交通甚至天气给出建议并主动设置。

这种交互背后是Gemini多模态能力的支撑。谷歌将语音、语义、环境感知等模块融合，使设备能像人类一样理解含混的意图。例如，当用户说“我觉得客厅有点暗”时，音箱能自动调节灯光亮度而非要求精确的百分比。这种从工具到伙伴的身份转变，正是谷歌对智能音箱未来的核心判断。

价格与策略：99.99美元的“入场券”

值得注意的是，新款Home Speaker定价仅99.99美元，与谷歌过去的Nest Audio持平，但功能却实现了跨越式升级。这背后是谷歌对市场格局的清醒认知：亚马逊Echo系列凭借先发优势占据全球约40%份额，苹果HomePod则以音质和生态锁定高端用户。谷歌需要一张既能吸引新用户、又能让老用户升级的“亲民牌”。

谷歌产品管理副总裁Catherine Porter在发布会上表示：“我们相信生成式AI不应只存在于高端旗舰设备中。99.99美元的价格，意味着每个人都能拥有一个真正能‘交谈’的家庭助手。”这一策略意图明显：通过低价快速铺开Gemini交互体验，收集更多真实对话数据以反哺模型训练，形成正向飞轮。

编者按：智能音箱的“新物种”之路

智能音箱自2014年亚马逊推出Echo以来，已走过十年。十年间，这品类经历了爆发增长、市场饱和到增长放缓的完整周期。截至2025年底，全球智能音箱保有量超过8.5亿台，但月活跃用户使用时长却连续三年下降。根本原因在于，现有语音助手的能力天花板明显：它们更像“语音遥控器”而非“智能伙伴”。

谷歌的Gemini思路或许给出了破局方向。但挑战同样严峻：生成式AI的延迟、安全性、隐私保护等问题在家庭场景中会被放大。例如，音箱需要实时处理噪音环境下的语音，并给出合乎道德的建议（如拒绝帮孩子设置暴力闹钟）。此外，亚马逊也已在Alexa中集成大模型Claude，苹果则计划通过Siri与Apple Intelligence整合来反击。这场“新智能音箱战争”本质上已演变为大模型落地能力的比拼。

对于用户而言，99.99美元能买到的不仅是硬件，更是一个不断进化的AI伙伴。谷歌宣称Home Speaker将获得至少5年的系统更新和模型升级，这意味着它可能在未来学会更多技能——从控制家电到陪孩子做作业，甚至分析家庭成员的情绪。

最终，谷歌能否凭借Gemini让智能音箱重回增长轨道，取决于两个关键因素：一是在真实家庭环境中，对话交互的准确率和自然度能否持续提升；二是谷歌能否有效保护用户隐私，避免类似“音箱误录家庭对话”的隐私丑闻。这条路并不轻松，但至少，谷歌迈出了打破“命令与控制”框架的第一步。

本文编译自TechCrunch

谷歌押注Gemini，重塑智能音箱新形态

从“命令”到“对话”：交互范式的根本转变

价格与策略：99.99美元的“入场券”

编者按：智能音箱的“新物种”之路

相关文章