AI资讯 — 行业快报与全球报道

测评

DeepSeek V4 Pro Smoke测试主榜暴涨48.7，工程判断却暴跌28.4

DeepSeek V4 Pro今日Smoke评测主榜从39.26跃升至87.99，代码执行从20分直接拉满至100分，但工程判断从38.4暴跌至10分，诚信评级从fail转为warn。单日10题快测波动是否反映真实能力变化，值得关注。

DeepSeek V4 Pro 代码执行 Smoke评测模型一致性

2026年5月29日 290

测评

Claude Sonnet 4.6主榜91.77断层领先，GPT-o3执行50分直接垫底

今日Smoke评测显示Claude Sonnet 4.6以91.77分登顶，代码执行满分、材料约束81.7分；GPT-o3执行仅50分垫底11名；DeepSeek V4 Pro诚信评级突降为fail，11模型中仅3个pass。

Claude Sonnet 4.6 材料约束 Smoke轻量评测执行维度

2026年5月29日 257

原创

日本股市AI半导体主题持续升温索尼与TSMC合作协议引市场关注

日本股市AI半导体板块近期表现活跃。索尼半导体解决方案公司与台积电达成下一代图像传感器合作协议，推动物理AI概念受到投资者追捧。日本市场人士在社交平台X上热议相关个股，多篇帖文获百次以上点赞。本文分析合作背景、市场反应及对产业链的潜在影响，

AI半导体索尼 TSMC

2026年5月28日 233

原创

NVIDIA副总裁称AI算力成本远超员工薪资双方激辩经济性

NVIDIA副总裁Bryan Catanzaro表示，其团队AI算力成本已超过员工薪资。该言论在X平台引发对立讨论，正方认可AI价值但指出基础设施压力，反方质疑AI投入产出比。文章基于公开事实，分析算力成本构成、行业影响及优化方向，区分已确

AI算力成本 NVIDIA高管言论 AI经济性质疑

2026年5月28日 297

原创

Anthropic Mythos 工具突破性发现超万开源漏洞，揭露OpenBSD 27年隐蔽缺陷

Anthropic公司推出的Mythos AI安全工具近日取得重大突破，已在全球开源项目中发现超过一万处安全漏洞，其中包括OpenBSD系统中长达27年未被发现的严重缺陷。这一进展凸显了人工智能在网络安全领域的应用潜力，同时也引发业界对AI

Anthropic Mythos 网络安全 AI漏洞检测

2026年5月28日 325

原创

AI原生组织奇点来临：Claude如何重塑财富500强业务模式

Peter Diamandis等行业大V近日热议AI原生企业如何借助Claude等工具快速复制财富500强业务线，中层管理岗位减少达90%，Cognition Labs ARR实现73倍增长。这一观点引发企业组织变革广泛讨论，本文从技术应用

AI-native 组织奇点 Peter Diamandis Claude

2026年5月28日 253

原创

中国AI顶尖人才出国旅行限制新规引发行业震动

中国出台AI顶尖人才出国旅行限制措施，影响阿里巴巴等公司专业人士。政策引发人才流动与地缘AI竞争讨论，属中英热门话题。该限制可能改变中国AI人才国际交流格局，业界担忧其对创新合作与人才保留的双重影响，需平衡国家安全与科技发展需求。

AI人才中国科技地缘竞争

2026年5月28日 411

原创

教皇Leo XIV发布AI通谕Magnifica Humanitas 全球科技伦理争议升温

梵蒂冈教皇Leo XIV发布首份AI通谕《Magnifica Humanitas》，警告人工智能潜在风险并呼吁加强全球监管，强调人类尊严优先于技术发展。此举在宗教界与科技界引发激烈讨论，聚焦AI伦理、人类挑战等议题，全球关注度持续高涨。

教皇 AI监管科技伦理

2026年5月28日 330

原创

亚马逊与Snowflake签署60亿美元五年AI协议，深化云端代理计算合作

亚马逊与Snowflake达成60亿美元五年协议，深化AWS在企业代理计算芯片中的角色，支持AI工作负载。此大额交易引发市场热议，凸显云AI基础设施竞争。协议将推动双方在数据云与AI基础设施的深度整合，助力企业级AI应用落地。

亚马逊 Snowflake AI芯片

2026年5月28日 261

原创

Perplexity开源Unigram分词器：CPU利用率降5-6倍，小模型推理效率显著提升

Perplexity近日开源重构后的Unigram分词器，可将CPU利用率降低5-6倍，有效提升小模型推理效率。该项目在GitHub发布后引发技术圈关注，反映了开源AI工具的持续发展趋势，有助于降低AI部署门槛并推动行业技术共享。

Perplexity tokenizer 开源

2026年5月28日 202

原创

xAI Grok 集成 KiloCode 编码智能：AI 代理开发工具迎来重大升级

xAI 正式宣布 SuperGrok 与 X Premium+ 用户可在 Kilo IDE 中使用 grok-build-0.1 模型，实现高速代理式编码智能。该产品发布引发开发者社区广泛关注，技术突破有望加速 AI coding 工具普及

xAI Grok KiloCode AI编码工具

2026年5月28日 280

原创

Anthropic推出Claude Marketplace，企业AI工具采购迎来新变革

Anthropic近日推出Claude Marketplace新功能，允许企业将现有Anthropic支出用于Augment Code、Bolt.new等Claude驱动产品，简化AI工具采购流程。该举措获得业界高度评价，标志着企业级AI采

Claude Anthropic 企业AI

2026年5月28日 207

原创

OpenAI基金会投入2.5亿美元推动AI时代经济转型与共享繁荣

OpenAI创始人Sam Altman宣布，OpenAI基金会将投入2.5亿美元，用于AI时代的测量、转型支持和新方法探索，旨在提升全球生活质量与个人自由。该举措迅速引发行业热议，聚焦AI对社会经济结构的深远影响，以及如何实现技术红利共享。

OpenAI AI经济 Sam Altman

2026年5月28日 442

测评

豆包 Pro 代码执行暴跌80分主榜单日掉41.2

豆包 Pro 主榜从81.33暴跌至40.12，代码执行单维度从100直接归零至20，材料约束小涨6.2分。单日抽签波动还是真实能力退化，需要重点关注。

豆包 Pro 代码执行 Smoke评测模型波动

2026年5月28日 370

测评

Gemini 3.1 Pro代码执行暴跌80分，主榜单日掉33.5

Gemini 3.1 Pro今日Smoke评测主榜从74分跌至40.48分，代码执行维度直接从100分崩到20分，材料约束小涨6分，诚信评级从fail转为pass。

Gemini 3.1 Pro 代码执行 Smoke评测单日波动

2026年5月28日 284

测评

Smoke评测全员腰斩：11模型主榜平均暴跌42分，代码执行维度集体失守

今日Smoke轻量评测显示11个主流模型主榜平均暴跌42分，代码执行维度从昨日普遍高位跌至20或0分，仅Gemini 3.1 Pro以40.48分勉强领跑，暴露当前模型在复杂代码任务上的极端脆弱性。

代码执行材料约束 Gemini 3.1 Pro 评测波动

2026年5月28日 334

原创

用户抵制Google AI搜索“强喂”，DuckDuckGo安装量激增30%

近期，搜索引擎DuckDuckGo的安装量同比增长30%，这一数据引发行业关注。用户对Google在其搜索结果中强行推送AI生成内容的做法表示不满，转而寻求更注重隐私和简洁体验的替代方案。DuckDuckGo凭借不追踪用户、拒绝AI过度介入

DuckDuckGo Google AI搜索隐私保护

2026年5月27日 195

原创

AI编码代理爆发：72小时内三款产品上线，重塑开发者智能付费模式

近期AI编码代理领域迎来爆发式增长，72小时内多款产品相继上线，包括Cursor和Anthropic相关工具，显著改变了开发者对AI智能的付费方式。X平台讨论热度高涨，本文深入分析这一技术突破对软件开发行业的影响，探讨新模式如何提升效率并引

AI coding agents Cursor 开发者工具

2026年5月27日 214

原创

教皇Leo XIV发布4.23万字AI通谕：人文优先引发硅谷与全球伦理辩论

教皇Leo XIV于近日发表长达4.23万字的AI专题通谕，明确警示人工智能可能带来的风险，强调必须将人文价值置于技术发展之上。该通谕迅速引发硅谷科技界与全球伦理学者的广泛讨论，《纽约时报》等主流媒体均给予重点报道。本文梳理通谕核心观点，分

AI伦理教皇通谕科技争议

2026年5月27日 275

原创

Google Gemini 进入代理时代：I/O 大会揭开 AI 主动服务新纪元

Google I/O 2025 发布 agentic Gemini，使 Gemini App 从被动响应转向主动 24/7 协助，支持笔记数字化、文件自动生成等功能。同时推出的视频编辑模型 Gemini Omni 引发业界热议，标志着生成式

Gemini Agentic AI Google I/O

2026年5月27日 253

原创