谷歌AI连自家名字都拼错,这尴尬了谁?

谷歌AI连自家名字都拼错,这尴尬了谁?

现象:AI不会拼写,连“Google”都写不对

近日,多位用户发现谷歌最新AI模型在对话中犯下低级拼写错误:将“Google”写成“Googel”、“Gogle”甚至“Goolge”。更令人尴尬的是,当有人要求它检查拼写时,AI自信地回答“拼写正确”。这并非孤例——该模型在拼写“strawberry”时少了“r”,在写“rhythm”时位置错乱。TechCrunch的Amanda Silberling发表评论称:“谷歌正在让自己难堪,又一次。”

核心原因:tokenization的盲点

为什么连基本的拼写都会出错?罪魁祸首是AI处理文本的方式——分词(tokenization)。大语言模型并不直接理解字母,而是将单词拆成更小的子词单元(token)。例如“Google”可能被拆成“Go”和“ogle”,模型关注的是这些token之间的概率关系,而非字母顺序。当拼写中出现细微变化时,模型无法像人类一样回溯检查字母序列,

“语言模型本质上是概率性的统计引擎,它学习的是词块搭配模式,而不是真正的拼写规则。”——AI研究员Karen Hao
这种机制使得模型在生成不常见单词或有重叠字符的序列时极易出错。

编者按:不只是“尴尬”,更是信任危机

谷歌AI的拼写问题看似小事,实则暴露了当前大语言模型的深层局限性。对于企业级产品(如Google Search、Google Workspace)而言,用户期待的是精准无误的文本输出。如果连公司自己的名字都写不对,如何让人信任AI生成的医学建议、法律条款或金融报告?

更值得思考的是,谷歌并非没有能力修复——它们在2024年就发布过拼写校正模型Spelling Correction Model(SCM),但显然未将其集成到最新对话式AI中。这反映出谷歌内部产品矩阵的割裂:研究部门与产品部门之间存在鸿沟。

对比与反思:OpenAI、Anthropic如何应对?

相比之下,OpenAI的GPT-4o与Anthropic的Claude 3.5在拼写测试中的表现明显更优。它们引入了字符级注意力机制后验证流程——在生成文本后额外运行一轮拼写检查。然而,即便是这些模型,在处理超长单词或跨语言拼写时依然会失误。本质上,只要模型不改造底层transformer架构中的tokenization,拼写问题就难以根除。

谷歌此次“自曝其短”或许是一个契机:推动行业重新思考语言模型的字符理解能力。毕竟,在AGI的宏大叙事下,连基本拼写都搞不定,难免让人质疑“智能”的含金量。

本文编译自TechCrunch