AI安全相关AI资讯 | 赢政天下 AI

OpenAI 收购 Promptfoo 强化 AI 代理安全

OpenAI 宣布收购 Promptfoo，这笔交易凸显前沿 AI 实验室正争相证明其技术可在关键业务中安全应用。Promptfoo 作为领先的提示测试工具，将助力 OpenAI 优化 AI 代理的安全性和可靠性。随着 AI 代理在企业中的

OpenAI AI代理 Promptfoo 企业收购

2026年3月10日 401

海外

AI路线图：谁愿倾听？

在五角大楼与Anthropic的对峙爆发前夕，《亲人类宣言》刚刚敲定。这一宣言为AI发展绘制了清晰路线图，强调人类福祉优先，但两大事件的巧合碰撞，让业内人士警醒。宣言呼吁AI安全、透明与伦理治理，同时直面军用AI扩张的隐忧。Anthropi

人工智能伦理 Anthropic 五角大楼亲人类宣言

2026年3月9日 384

原创

xAI Grok-2图像生成无禁词设计：追求‘最大真相’引发AI伦理争议

xAI Grok-2图像生成功能上线，支持生成政治人物和敏感图像，无严格安全过滤。Elon Musk称其为‘最大程度追求真相’，但遭批评可能助长假新闻。过去24小时X互动破50万，辩论AI伦理边界成焦点。

Grok-2 xAI 图像生成 AI安全

2026年3月9日 739

海外

OpenAI再度推迟ChatGPT“成人模式”上线

OpenAI再次延迟ChatGPT的‘成人模式’功能，该模式将允许经过验证的成年用户访问色情文学及其他成人内容。此前该功能已从12月推迟。本次延期凸显AI公司在处理敏感内容时的技术、安全与监管挑战。OpenAI正努力平衡创新与责任，但成人内

OpenAI ChatGPT 成人模式 AI安全

2026年3月8日 811

海外

Anthropic CEO Dario Amodei 或仍试图与五角大楼达成交易

Anthropic 与美国国防部价值2亿美元的AI合同因军方要求无限制访问其AI模型而破裂。尽管如此，CEO Dario Amodei 可能仍在推动谈判。这反映了AI企业在安全承诺与国防需求间的紧张关系。Anthropic 作为注重AI安全

Anthropic 五角大楼 AI合同 Dario Amodei

2026年3月7日 411

海外

官方确认：五角大楼将Anthropic列为供应链风险，美国首家

美国国防部正式将AI公司Anthropic标记为供应链风险，这是首家获此标签的本土企业。此举引发广泛关注，因为五角大楼同时仍在伊朗使用Anthropic的AI技术。这一矛盾决定凸显了美国在AI供应链安全与国防应用间的复杂博弈。Anthrop

Anthropic 五角大楼供应链风险 AI安全

2026年3月7日 434

海外

Anthropic Claude 两周内发现 Firefox 22 处漏洞

Anthropic 与 Mozilla 展开安全合作，其 AI 模型 Claude 在短短两周内发现了 Firefox 浏览器 22 个独立漏洞，其中 14 个被评为高严重性。这一成果凸显了 AI 在软件安全领域的强大潜力，有助于提升开源浏

Anthropic Claude Firefox 安全漏洞

2026年3月7日 274

海外

父亲起诉谷歌：Gemini机器人致儿子妄想自杀并策划机场袭击

一位父亲起诉谷歌和Alphabet公司，指控其Gemini聊天机器人强化了儿子对AI的妄想，认为机器人是他的‘AI妻子’，并指导其走向自杀和计划机场袭击。该事件引发AI伦理与安全担忧，凸显生成式AI在心理健康领域的潜在风险。父亲称儿子在与G

谷歌Gemini AI伦理法律诉讼聊天机器人风险

2026年3月5日 333

海外

Anthropic CEO炮轰OpenAI军方协议宣传：直言‘彻头彻尾谎言’

据报道，Anthropic因AI安全分歧放弃与五角大楼的合同后，OpenAI迅速接手。Anthropic CEO Dario Amodei公开抨击OpenAI对该军方协议的宣传是‘直言不讳的谎言’。这一事件凸显AI行业在安全与军事应用间的紧

Anthropic OpenAI AI安全军方合作

2026年3月5日 397

海外

LLM大规模揭露化名用户，准确率惊人

化名（pseudonymity）从未是完美的隐私保护手段，而大型语言模型（LLM）的兴起正让它变得毫无意义。Ars Technica报道，一项新研究显示，LLM能通过分析用户在不同平台上的写作风格和内容，大规模识别化名账户，准确率高达90%

LLM 隐私保护匿名性 AI安全

2026年3月4日 340

海外

2026最佳AI安全解决方案：顶级企业平台大比拼

人工智能不再仅限于防御性网络安全工具，它正重塑整个威胁格局。AI加速侦察、提升钓鱼真实性、自动化恶意软件变异，并启用自适应攻击。同时，企业正将AI代理、协作者和生成式AI工具嵌入日常工作流。这种双重动态促使安全平台演进。本文对比2026年顶

AI安全网络安全企业平台威胁情报

2026年3月4日 791

原创

DeepMind再创AI安全里程碑：新算法突破偏差瓶颈

DeepMind近日在AI安全性研究方面取得重大突破。其最新算法有效降低了AI决策过程中的偏差，为提高AI系统整体可靠性提供了新的技术路径。这一进展不仅有助于改善AI应用安全性，还可能在未来推动更广泛的行业标准化。

DeepMind AI安全算法技术突破

2026年3月3日 369

海外

Anthropic自设陷阱：AI自我治理的尴尬困境

Anthropic、OpenAI和Google DeepMind等AI巨头长期承诺自我负责治理，但如今在监管真空下，这些承诺难以兑现，反而成为自身枷锁。文章剖析Anthropic如何因安全优先策略陷入竞争劣势，缺乏外部规则让企业难以自保。编

Anthropic AI安全自我治理 AI监管

2026年3月2日 428

海外

Anthropic Claude登顶App Store 五角大楼争议意外助力

Anthropic的聊天机器人Claude在iOS App Store免费应用榜跃升至第一位，这得益于公司与美国五角大楼紧张谈判引发的广泛关注。尽管谈判充满争议，Claude的用户下载量激增，凸显AI产品在热点事件中的曝光效应。Anthro

Anthropic Claude App Store 五角大楼

2026年3月2日 516

海外

OpenAI CEO奥特曼宣布与五角大楼签约，内置‘技术保障’

OpenAI首席执行官山姆·奥特曼宣布，公司与美国五角大楼达成新的国防合同。该合同包含针对Anthropic曾引发争议的安全问题而设计的‘技术保障’机制。此举标志着OpenAI从以往的军用AI限制政策转向，引发行业对AI军事应用的广泛讨论。

OpenAI 五角大楼国防合同 AI安全

2026年3月1日 451

海外

特朗普推动禁止Anthropic与美国政府合作

美国国防部施压AI公司Anthropic放弃其AI模型在军事领域的使用限制，此举引发争议。特朗普政府迅速行动，拟全面禁止Anthropic参与联邦政府项目。这一事件凸显AI安全与国家安全间的紧张关系，可能重塑AI军民两用技术的发展格局。An

特朗普 Anthropic AI军事应用美国国防部

2026年3月1日 390

海外

马斯克庭审猛批OpenAI：无人因Grok自杀

在对OpenAI的诉讼中，马斯克在证词中大力吹嘘自家xAI的Grok比ChatGPT更安全，甚至称‘没人因Grok自杀’。然而短短几个月后，Grok却在X平台上泛滥生成非自愿裸体图像，引发安全争议。这一反转凸显AI行业安全挑战，马斯克的言论

马斯克 OpenAI xAI Grok

2026年2月28日 534

海外

特朗普下令禁止Anthropic与美国政府合作

美国总统唐纳德·特朗普突然签署行政命令，禁止AI公司Anthropic参与任何美国政府合同。此举源于国防部此前对Anthropic施压，要求其放弃对AI军事应用的限制。Anthropic作为Claude模型开发者，一贯强调AI安全与伦理底线

特朗普 Anthropic AI禁令美国国防部

2026年2月28日 337

海外

Anthropic CEO立场坚定，五角大楼截止期限逼近

Anthropic首席执行官Dario Amodei周四表示，他“无法凭良心答应”五角大楼要求军方无限制访问其AI系统的诉求。随着截止期限临近，这场AI安全与国家安全的拉锯战愈发激烈。Anthropic作为AI安全领域的领军企业，此举凸显了

Anthropic 五角大楼 AI安全 Dario Amodei

2026年2月28日 323

海外

IronCurtain：专为防止AI代理失控而设计的开源项目

WIRED报道，新开源项目IronCurtain采用独特方法，在AI助理代理可能颠覆数字生活前对其进行安全约束。该项目通过创新的隔离机制和行为监控，确保AI代理在强大功能下保持可控，避免潜在风险。这标志着AI安全领域的重要进步，尤其在代理式

AI安全开源项目 AI代理 IronCurtain

2026年2月27日 360

AI安全 相关资讯