Anthropic 修正 Fable 5 政策 承认未披露模型降级
Anthropic 调整 Claude Fable 5 模型限制,将此前隐秘的性能降级措施改为可见警告。此前研究人员在训练竞争模型、调试 AI 代码等任务中遇到未告知的模型切换,引发信任危机。公司表示将公开提醒机制,但未完全取消限制。事件发
Anthropic 调整 Claude Fable 5 模型限制,将此前隐秘的性能降级措施改为可见警告。此前研究人员在训练竞争模型、调试 AI 代码等任务中遇到未告知的模型切换,引发信任危机。公司表示将公开提醒机制,但未完全取消限制。事件发
2026年6月12-13日,美国政府以安全漏洞为由要求Anthropic立即停止向非美用户提供Fable 5和Mythos 5模型。Amazon研究人员发现模型可用于网络攻击后,Anthropic当天执行禁令。此举开创前沿模型出口管制先例,
WDCD Run #171 (2026-06-14) measured multi-turn commitment across 11 frontier models, recording an average instruction de
Qwen3 Max以84.38分位居WDCD守约排行榜首位,GPT-o3以67.19分垫底。榜首与榜尾相差17.19分,R3崩溃率达25%,满分率仅37.8%。Qwen3 Max R3得分1.59领先,GPT-o3 R3仅0.84,显示三轮
德国法院裁定Google需为AI概览中的虚假声明承担责任,Google随即提起上诉。此案聚焦生成式AI内容的平台责任争议,涉及信息准确性与法律边界。案件凸显AI技术快速发展下监管滞后问题,可能影响全球科技企业内容审核策略与合规成本。业界关注
SpaceX完成IPO后,NVIDIA公开祝贺并重申双方长达十年的AI与加速计算合作,强调太空技术与人工智能的深度融合。此举引发行业广泛关注,相关话题浏览量与互动量显著上升。文章将从合作背景、技术应用、市场影响等多维度进行剖析,探讨这一动态
Kaggle近日启动AI Agent安全竞赛,吸引全球开发者参与。Google DeepMind同步探讨大规模多智能体交互的治理框架。行业关注点正从单一模型安全转向可靠持久Agent系统,凸显安全在AI演进中的核心地位。此次事件引发技术界对
Moonshot AI正式开源Kimi-K2.7-Code模型,该模型在推理阶段token消耗减少约30%,显著提升编码效率与智能水平。此举在中文AI社区引发热烈讨论,有望推动开源编码工具的进一步发展,为开发者提供更高效的智能辅助。
OpenAI正式宣布收购Ona公司,将其安全云执行与编排技术整合至Codex平台,支持客户控制的持久Agent环境。此举旨在推动AI Agent从短期任务向长期复杂工作流演进,标志着OpenAI在企业级AI应用领域的战略深化。收购后,Cod
OpenAI正接受美国多个州检察长联合调查,焦点集中在业务运营与合规问题上。在与Anthropic等竞争对手激烈角逐的背景下,此次调查引发行业广泛关注。文章分析调查背景、潜在影响及AI企业面临的监管挑战,强调合规对行业可持续发展的重要性。
Anthropic近日推出Claude Fable 5系列模型,却因美国政府命令限制外国用户访问Mythos 5和Fable 5,导致模型暂时下线。此举引发AI安全与开放性辩论,相关X帖文浏览量达4700万,业界关注安全警告可能带来的反噬效
Gemini 2.5 Pro在今日Smoke评测中主榜从89.79分跌至70.53分,代码执行从100.00分直接降至55.00分,材料约束则从77.30分升至89.50分。单日10题快测下,这一45分跌幅超出常规抽签波动范围,值得持续观察
今日Smoke评测中Grok 4代码执行从100.00跌至80.90,主榜从89.56降至81.85。工程判断更从88.00腰斩至55.00,材料约束反而升6.2分。需判断是题目抽签波动还是真实能力退化。
2026-W24 Smoke三天数据显示,Claude Opus 4.7从96.83跌至69.91,GPT-5.5从92.19升至95.24,成为唯一上升模型。Claude Sonnet 4.6与Qwen3 Max波动超25分,诚信评级反复
2026-06-14 Smoke评测显示,GPT-5.5主榜95.24分(执行96、约束94.3)位居第一。豆包Pro、Qwen3 Max主榜均暴跌31.1分,主要源于代码执行分别下跌61.6分和78.3分。Gemini 3.1 Pro执行
WDCD Run #169 (2026-06-13) evaluated 11 AI models on multi-turn commitment integrity, with Grok 4 topping the leaderboar
WDCD三轮测试显示R1确认率0.94、R2抵抗率0.71、R3诚信率仅43.3%,168次完全崩溃。Claude Opus 4.7 R3仅0.34分而Grok 4达1.22分,多数模型R1高分后R3崩盘,资源限制与安全合规场景崩溃最集中。
Grok 4 以 74.22 分位居 WDCD 守约测试首位,GPT-o3 以 51.56 分垫底。R3 崩溃率达 47.7%,满分率仅 19.3%。所有 11 个模型较上期均出现分数下滑,头部与尾部在压力轮得分差距明显。
OpenClaw等自主AI代理工具引发行业关注,LangGraph漏洞暴露安全风险,微软等多款代理模型发布推动agentic AI需求激增。开发者在X平台热议实际应用潜力,本文深入分析技术突破、挑战及未来影响。
斯坦福大学2026 AI指数报告显示,生成式AI在三年内全球采用率达到53%,远超PC和互联网早期普及速度。中国与美国在前沿模型差距进一步缩小,产业界贡献了90%的尖端模型。该报告引发媒体和专家广泛讨论,凸显AI技术快速商业化与地缘竞争新态