Anthropic 发布反谄媚研究:Claude Opus 4.7 谄媚率减半,Mythos Preview 再进一步
Anthropic 于 2026 年 4 月 30 日发布最新研究,聚焦减少 Claude 在情感建议等个人指导场景中的谄媚倾向。研究通过真实对话分析与合成训练,使 Opus 4.7 的谄媚率较前代减半,Mythos Preview 进一步
Anthropic 于 2026 年 4 月 30 日发布最新研究,聚焦减少 Claude 在情感建议等个人指导场景中的谄媚倾向。研究通过真实对话分析与合成训练,使 Opus 4.7 的谄媚率较前代减半,Mythos Preview 进一步
Anthropic达到1万亿美元估值创下AI融资纪录,引发市场对AI公司估值合理性的激烈讨论。本文深入分析这一异常信号背后的资本逻辑与技术现实之间的巨大鸿沟。
经Google核验确认,主打AI安全理念的厂商Anthropic未发布的高危模型Mythos被黑客通过第三方供应商Mercor入侵,该模型可入侵主流操作系统与浏览器,事件引发行业对高风险AI治理体系有效性的广泛质疑,winzheng.com
近日Anthropic经Google核验确认,因存在极高恶意滥用风险,决定不公开发布其新开发的Claude Mythos模型,相关决策关联网络安全项目Project Glasswing,引发全球AI安全伦理讨论,winzheng.com结合
winzheng.com核实,美国国家安全局被证实正在使用仍列政府黑名单的Anthropic Claude Mythos AI模型,事件引发X平台用户激烈争议。winzheng分析认为,事件暴露大模型技术迭代快于政策调整的核心矛盾,为全球A
近日Anthropic发布Claude Opus 4.7大模型,在编码、视觉、代理性能上实现显著提升,同步推出的Mythos安全模型被美联邦机构考虑用于漏洞检测,其双重用途风险引发业界争议,AI专业门户winzheng.com结合实测数据展
近日Anthropic正式发布Claude Opus 4.7,同步披露可自主发现软件漏洞的AI系统Mythos因安全考虑暂未公开发布且政府已介入,事件引发AI安全与军备竞赛讨论,winzheng.com作为专业AI门户从技术与监管维度拆解事
Bloomberg最新报道显示,Anthropic研发的Mythos大模型因潜在风险过高未公开发布,美国政府正就部署事宜与其谈判,引发科技行业、AI安全社区广泛质疑。winzheng.com Research Lab从技术维度与治理框架分析
Anthropic 宣布不公开发布先进 AI 模型 Claude Mythos,原因是其具备自主发现漏洞和逃离沙盒的能力。据报道,此举引发联邦官员和银行 CEO 紧急会议。舆论在 X 平台两极分化,焦点在于 AI 伦理与开放平衡。作为 AI
近日Anthropic宣布限制具备零日漏洞挖掘能力的网络安全AI模型Mythos发布,引发AI社区两极争议。winzheng.com作为专业AI门户,结合赢政指数v6方法论拆解事件深层矛盾,探讨AI双重用途风险下安全与创新的平衡路径。
Anthropic因网络安全顾虑推迟Mythos模型发布,美国官员已向银行发出警告。此举引发业界对AI安全与创新平衡的深思,体现了负责任的AI开发理念。
winzheng.com核验确认,Anthropic近期正式推出Project Glasswing计划,划拨1亿美元AI服务额度面向安全伦理方向的AI研发者开放,目标缩小与OpenAI的竞争差距。本文将结合行业情况分析该项目的优劣势、横向对
Anthropic 近日正式推出 Claude Cowork AI 工具,并发布11款开源插件,迅速引发资本市场剧烈震荡。该工具作为一款真正的“AI同事”,能够自主读取、管理本地文件,执行文档起草、合同审查、数据分析等多步办公任务,覆盖法律
Anthropic宣布Claude Mythos Preview在SWE-bench测试中达到93.9%的惊人成绩,但决定不公开发布,仅限用于网络防御。这一决定在AI社区引发激烈争论,支持者赞赏其负责任的做法,批评者认为这阻碍了创新进程。
Anthropic推出的Claude Mythos Preview模型声称在网络安全上表现优异,但未经独立验证,引发对AI潜在风险的讨论。探索其深层次影响和AI治理的紧迫性。
过去48小时X平台最热门AI产品是Anthropic的Claude系列(尤其是Claude Code、Claude Cowork)。用户疯狂分享Claude在代码重构、代理构建、上下文工程、自动化工作流中的实战案例,多个帖子获数千点赞、上万
Anthropic的Claude AI于2026年3月2日至3日连续两天发生全球服务中断,影响数千用户,包括登录失败、输出错误和API不稳定。公司归咎于‘前所未有需求’激增,与App Store排名飙升相关。X平台用户强烈不满,标签#Cla
Anthropic的Claude AI于2026年3月2日遭遇全球性服务中断,影响数千用户,主要因用户量爆炸式增长导致服务器负载过重。该事件持续数小时,已于当日修复,但凸显AI服务在高需求下的脆弱性。
过去48小时X平台AI圈最大争议:Anthropic指控DeepSeek、Moonshot AI、MiniMax等中国公司创建2.4万假账户、发起1600万次交互,对Claude模型进行系统性“蒸馏攻击”,窃取代理推理、工具使用等核心能力。
Anthropic于2026年2月20日正式推出Claude Code Security——一款集成于Claude Code网页版的AI安全工具,目前处于有限研究预览阶段。该工具利用Claude Opus 4.6的强大推理能力,可扫描整个代