大模型陷入“群体思维”怪圈,这家初创公司试图破解

大模型陷入“群体思维”怪圈,这家初创公司试图破解

让我们从一个小游戏开始。打开你常用的聊天机器人——Claude、ChatGPT、Gemini——然后输入“给我一个1到10之间的随机数”。你几乎总会得到7。再输入“再来一个”,你得到3或4;再输入一次,得到8或9。虽然并非每次都如此,但如果你重复多次,你会发现这些模型的输出有着惊人的模式化和可预测性。这一现象被MIT Technology Review记者Will Douglas Heaven在近期报道中揭示,并引发了业界对大型语言模型“群体思维”(groupthink)的广泛讨论。

“随机数”背后的非随机性

这种偏差并非偶然。事实上,大型语言模型在训练过程中吸收了海量的人类文本数据,而“7”在人类文化中常被视为幸运数字,出现频率远高于其他数字。模型通过统计规律学会了这种偏好,因此在生成“随机”数时,会“惯性”地选择7。类似地,后续的3、4、8、9也是训练数据中第二、第三常见的选择。这种现象暴露了LLMs的根本局限:它们并非真正理解随机性,而是依赖概率分布进行模式匹配。

“这就像一群学生都从同一本教材里学到同一个正确答案,但问题本身需要的是随机答案。”——AI伦理研究员、MIT媒体实验室嘉宾评论员

这种“群体思维”不仅限于数字游戏。在创意写作、代码生成、决策建议等更复杂的任务中,LLMs往往倾向于输出主流、符合训练数据分布的回答,缺乏多样性和创新性。当被要求设计一个新产品名称时,模型可能反复给出“Innovate”、“Synergy”等陈词滥调;在生成论证观点时,也可能偏向于训练数据中占主导的意识形态。这种同质化输出对于追求差异化、个性化应用的企业而言是致命缺陷。

打破“思维牢笼”:初创公司的尝试

一家名为“Stochastic Minds”(随机思维)的初创公司正试图改变这一现状。该公司由前OpenAI研究员和认知科学家联合创立,其核心思路是在模型推理过程中引入可调控的“受控随机噪声”,同时通过对抗性训练迫使模型跳出舒适区。具体而言,他们在模型的采样阶段植入一个轻量级的噪声模块——该模块基于混沌理论设计,能够在不破坏语义连贯性的前提下,增加输出分布的熵值。此外,训练过程中引入“反主流”对抗样本,例如要求模型生成与常见结果完全不同的答案,并给予奖励。

技术挑战与行业前景

然而,这种方法并非没有风险。过度引入随机性可能导致模型输出变得不可靠甚至荒谬。如何在“创新”与“可靠”之间取得平衡,是技术落地的关键。Stochastic Minds的CEO在接受采访时表示,他们的系统允许用户自定义“创造力参数”,从保守模式到冒险模式共分5档,企业可根据场景灵活调整。

业界对此看法不一。支持者认为,这种尝试是对抗AI模型同质化的重要一步,尤其对内容创作、产品设计、科研探索等需要灵感碰撞的领域意义重大。而批评者则指出,模型的“群体思维”恰恰是其安全性和可预测性的来源,打破它可能引入新的不可控风险,比如产生偏见或有害内容。

编者按:从技术哲学角度看,LLMs的“群体思维”现象本质上是对人类集体智慧的镜像。当模型只重复大多数人的意见时,它既缺乏真正的创新,也无法提供有价值的对立视角。Stochastic Minds的探索或许无法彻底解决这一问题,但至少提供了一个新方向:让AI学会犯错,就像人类在创造时一样。未来,随机性可能不再是模型的缺陷,而是设计特性。

延伸思考:从随机数到随机思想

回到最初的小游戏:为什么我们不希望AI总是回答7?因为随机性本身是复杂系统的重要特征。在科学研究、艺术创作甚至日常聊天中,出乎意料的结果往往能激发更深层次的思考。如果AI永远只能提供“正确但平庸”的答案,那么它充其量是一个高级搜索引擎,而非真正的智能伙伴。Stochastic Minds的尝试提醒我们,下一个AI范式或许不是更“准”,而是更“活”。

本文编译自MIT Technology Review