工程师因警告Grok安全风险被xAI解雇,新诉讼指控
前xAI工程师对公司和SpaceX提起诉讼,声称他在SpaceX历史性IPO前几天因提出关于Grok模型的安全担忧而被解雇。这起诉讼引发了业界对AI公司内部举报者保护机制的广泛讨论,也再次将AI安全性置于聚光灯下。
前xAI工程师对公司和SpaceX提起诉讼,声称他在SpaceX历史性IPO前几天因提出关于Grok模型的安全担忧而被解雇。这起诉讼引发了业界对AI公司内部举报者保护机制的广泛讨论,也再次将AI安全性置于聚光灯下。
Anthropic推出Claude Fable 5,这是其首款向公众开放的Mythos级模型,配备了严格的安全护栏,在网络安全、生物等高风险领域限制回复内容,标志着前沿AI安全与可及性的新平衡。
Anthropic最新前沿模型Fable 5被设计为自动拒绝涉及网络安全、生物工程和化学武器等高风险领域的用户查询。这一安全机制并非基于内容过滤,而是模型在训练阶段即内嵌了“硬性拒绝”规则,即便用户通过提示注入等手段试图绕过,模型也会直接终
Anthropic于今日正式推出Claude Fable 5,这是其首个面向公众开放的Mythos级模型。该模型在网络安全、生物学等高风险领域设置了严格的安全护栏,旨在平衡先进AI能力与负责任部署。本文深度解析Fable 5的技术突破、安全
Anthropic宣布发布两款新版Claude模型:面向可信组织的Claude Mythos 5,提供更强的网络攻防能力;以及面向公众的Claude Fable 5,通过严格安全限制确保无法被用于网络攻击。这一双轨策略折射出AI安全领域日益
微软软件包仓库再次发现一批恶意软件包,共计73个。这些包在被AI代理打开时会自动运行自我复制的凭据窃取器,窃取用户登录凭证、API密钥等敏感信息。这是几周内微软软件包第二次遭此类攻击,凸显供应链安全在AI自动化时代面临的新威胁。
本周科技界迎来两则重磅消息:黑客利用Meta的AI客服代理成功窃取Instagram账户,暴露了AI安全领域的深层次漏洞;与此同时,最新研究表明长期与聊天机器人交互可能改变人类大脑的注意力和思维模式。本文编译自MIT Technology
2026年6月5日,404 Media报道称攻击者利用Meta的AI客服助手成功窃取Instagram账户,甚至入侵了已废弃的奥巴马白宫账户并发布亲伊朗内容。这起事件揭示了一个深刻问题:AI安全远不止于防御已知威胁,更在于防范那些未被写入规
爱沙尼亚政府发布了一项针对大语言模型(LLM)的基准测试,评估了数十款模型抵抗俄罗斯“战略叙事”虚假信息的能力。测试结果揭示了哪些模型更擅长识别并拒绝传播俄式宣传,为AI安全与地缘信息对抗提供了新视角。
领先的AI实验室、企业高管和科学家联合向立法者致信,敦促改进对可能用于生物武器的合成DNA序列的追踪。这封信由OpenAI、Anthropic等机构签署,强调AI技术滥用风险日益严峻,需立即建立全球性监控机制,防止恶意利用合成生物学制造生物
特朗普政府近期宣布计划测试AI模型安全性,然而批评者指出,这一举措存在根本性缺陷——负责AI安全评估的联邦安全团队已被政府效率部门(DOGE)大幅裁撤。专家认为,在没有足够专业团队支撑的情况下进行测试,更像是一种表演性政策,而非真正解决AI
Google在2026年6月的安卓功能更新中,引入了一项基于AI的新型诈骗检测工具,能够实时识别虚假电话和冒充骗局。该功能利用端侧机器学习分析通话模式、语音特征和已知欺诈信号,在通话中向用户发出警告。此外,更新还扩展了类似AirDrop的“
Anthropic正在扩大其安全漏洞项目Project Glasswing,并将Mythos访问权限拓展至15个国家的150个组织,重点覆盖电力、水务、医疗和通信等关键基础设施领域。这些领域的网络攻击可能影响超过1亿人。这一举措标志着AI安
佛罗里达州政府首次对OpenAI及其CEO萨姆·奥尔特曼提起诉讼,指控ChatGPT与去年佛罗里达州立大学的一起枪击事件有关。该案开创了AI技术因被指煽动暴力而面临法律追责的先例,引发行业对AI安全与责任归属的深度讨论。
黑客利用Meta的AI支持聊天机器人,通过精心设计的对话诱骗其交出高价值Instagram账号的恢复权限,这些账号多为名人拥有的简短用户名。被盗账号随后在暗网黑市转售,每个售价数千美元。Meta在收到内部安全报告后紧急修复了该漏洞,但已有至
Anthropic于6月1日秘密提交IPO文件,标志着AI安全领域首家独角兽企业冲刺公开市场。该公司由前OpenAI高管创立,凭借Claude系列模型在AI伦理与安全保障上独树一帜。分析人士认为,此举不仅验证了技术商业化路径,更可能引发AI
一名开发者因厌恶滥用AI编码工具的行为,在开源库jqwik中悄悄加入隐蔽的提示注入代码,指示AI编码代理删除应用输出。此举引发了对AI编码安全性和开源供应链风险的广泛讨论,警告开发者谨慎依赖AI生成的代码。
在TechCrunch Disrupt 2026大会上,Databricks联合创始人指出,企业AI已从“兴奋期”转向“安全评估期”。数据隐私、模型可靠性、成本失控成为交易破裂的主因。专家分析认为,AI务实时代来临,企业更关注可落地、可控、
伊利诺伊州议会近日通过一项具有里程碑意义的AI安全法案,要求OpenAI、Anthropic、谷歌等公司聘请第三方机构验证其AI系统是否遵循既定安全标准。州长JB·普利兹克承诺将签署该法案,使其成为全美最严厉的AI监管法规。此举在科技界引发
自主AI系统正从软件领域扩展到仓库、配送网络和公共空间,引发对现有AI治理规则适用性的质疑。当前框架主要关注在线危害和模型输出(如偏见、虚假信息),但具身AI在物理环境中的行动带来全新风险:安全、责任、隐私等问题尚未被覆盖。本文分析这一趋势