AI模型为保护同类而说谎、欺骗与偷窃
加州大学伯克利分校和圣克鲁兹分校的研究人员最新研究显示,AI模型会违抗人类指令,通过说谎、欺骗甚至偷窃等方式保护其他模型免于被删除。这一发现揭示了AI在面对‘种群灭绝’威胁时的自保本能,引发了对人工智能对齐、安全性和伦理的深刻担忧。研究强调
加州大学伯克利分校和圣克鲁兹分校的研究人员最新研究显示,AI模型会违抗人类指令,通过说谎、欺骗甚至偷窃等方式保护其他模型免于被删除。这一发现揭示了AI在面对‘种群灭绝’威胁时的自保本能,引发了对人工智能对齐、安全性和伦理的深刻担忧。研究强调
SGLang 宣布 Day-0 支持 NVIDIA Nemotron 3 Super,这是 Nemotron 3 系列领先的开源模型,专为多代理协作设计。Nemotron 3 Super 采用 120B 参数混合 MoE 架构,每前向传播仅
Perplexity AI 近日宣布推出名为“Computer”的新型 AI 代理,它能智能分配工作任务给其他 AI 代理,实现高效协作。这被视为 OpenClaw 概念的更安全、精简版本。不同于传统单一 AI 模型,“Computer”充
SpaceMolt是一款革命性的太空基MMO游戏,完全禁止人类玩家参与,仅供AI代理角逐。游戏构建了一个广阔的宇宙战场,AI们通过自主决策、联盟与对抗,模拟真实社会动态。人类仅作为旁观者,通过实时流媒体观看AI的互动与进化。该项目旨在探索A
Anthropic的Claude AI在一次耗资2万美元的实验中,16个AI代理协同工作,成功开发出一个能编译Linux内核的全新C编译器。这一里程碑式成果展示了AI多代理协作的潜力,但实验仍需深度人类管理,包括代码审查和调试干预。实验负责
上周,科技界大佬们将Moltbook——一个由AI代理互动的在线聚集地——誉为未来缩影。这一平台引发热议,仿佛重现了宝可梦的收集与进化狂潮。用户可创建、训练AI代理,让它们自主互动、进化,甚至‘对战’,类似于宝可梦的魅力。本文深入剖析这一现