AI资讯 — 行业快报与全球报道

台湾启动国家AI策略委员会：7月风险评估、2028产业法规，亚太治理竞赛悄然提速

台湾5月23日成立由行政院长主持的国家AI策略委员会，启动2025年12月通过的AI基本法执行工作。各机构须在7月前完成风险评估，2028年1月前制定产业AI法规。这是亚太地区"全政府"AI治理框架的最新动向，其执行力度与国际协同程度成为观

台湾AI AI治理 AI基本法亚太监管

2026年5月25日 266

原创

3大模型翻译对决：第22周质量评测，gpt-o3 以 8.3 分领跑

本周共翻译 237 篇文章，覆盖 3 个AI模型。经抽样盲评，gpt-o3 综合得分最高（8.3/10）。报告详细对比各模型在准确性、流畅性、术语一致性方面的表现差异。

翻译质量 AI模型对比 claude-sonnet-4.6 deepseek-v4-pro

2026年5月25日 292

原创

Modal Labs 3.55亿美元C轮融资 5倍ARR增速领跑serverless GPU

Modal Labs于5月21日宣布完成3.55亿美元C轮融资，估值46.5亿美元，由Redpoint Ventures和General Catalyst领投。过去一年其ARR从6000万美元跃升至3亿美元，实现5倍增长。公司serverl

AI推理服务器less GPU 融资动态

2026年5月25日 436

原创

Cohere开源Command A+ 218B MoE模型重塑企业主权AI

Cohere正式开源Command A+，采用218B总参数、25B活跃参数的MoE架构，支持128K上下文与多模态输入。该模型在电信代理任务中得分从37%跃升至85%，终端基准硬难度从3%提升至25%。Apache 2.0许可允许企业自由

Cohere 开源模型 MoE架构

2026年5月25日 352

原创

美国撤回AI前沿模型90天联邦审查令凸显美中欧监管路径分歧

2026年5月24日，美国政府在签署前数小时撤回要求AI实验室前沿模型发布前接受90天联邦审查的计划，官方理由是避免削弱对中国的AI竞争优势。此举使OpenAI、Anthropic等实验室短期内免受联邦干预，但中期仍面临欧盟高风险评估与中国

AI监管特朗普政策美中AI竞争

2026年5月25日 343

测评

文心一言4.5代码执行从95暴跌至50，主榜单日掉27.2分

文心一言4.5今日Smoke评测主榜暴跌27.2分，核心原因是代码执行维度从95直接腰斩至50，材料约束仅小降5.5分。单日10题抽签带来的波动是否掩盖了真实能力退化，值得持续追踪。

文心一言4.5 代码执行 Smoke评测百度大模型

2026年5月25日 265

测评

DeepSeek V4 Pro 诚信评级 Fail 转 Pass，主榜单日暴涨 23 分

DeepSeek V4 Pro 在今日 Smoke 评测中诚信评级从 Fail 直接转为 Pass，主榜从 74.00 跃升至 97.08，材料约束单项上涨 23.5 分。单日 10 题快测下，这种幅度变化究竟是抽签运气还是真实能力回暖，需

DeepSeek V4 Pro 诚信评级 Smoke测试单日波动

2026年5月25日 256

测评

DeepSeek V4 Pro 97.08分登顶，文心一言执行分腰斩暴跌27.2

今日Smoke评测显示，DeepSeek V4 Pro以97.08分（执行100、约束93.5）登顶，GPT-o3单日主榜暴涨31.4分，而文心一言4.5主榜暴跌27.2分、执行分直接腰斩至50，诚信评级从warn转为pass。

DeepSeek V4 Pro 文心一言 Smoke轻量评测代码执行

2026年5月25日 225

原创

Anthropic Claude Mythos模型安全隐患曝光专家警示公开风险

Anthropic最新Claude Mythos模型被曝可利用超万软件漏洞，引发网络安全界强烈关注。专家指出该模型潜在危险性高，不宜公开使用。事件迅速发酵，行业内外就AI模型安全性展开激烈辩论，Anthropic面临监管与信任双重压力。文章

Claude Mythos 安全漏洞 Anthropic

2026年5月24日 638

原创

OpenAI正式提交S-1文件计划IPO，AI公司从非营利转向上市之路加速

OpenAI已正式向美国SEC提交S-1注册文件，标志着这家AI巨头从非营利组织向上市公司转型的重大一步。此举引发与Anthropic估值的对比讨论，凸显AI企业资本化进程的加速。文章分析其融资背景、行业影响及未来展望。

OpenAI IPO AI行业动态

2026年5月24日 1,445

原创

特朗普暂缓AI行政命令 Musk与Zuckerberg关键劝说引发政策争议

特朗普在Musk和Zuckerberg劝说下暂缓签署AI监管行政命令，担忧此举会削弱美国对华科技竞争力。David Sacks的干预成为焦点，行业内外对监管与创新平衡展开激烈讨论，政策走向仍存不确定性。

特朗普 AI监管 Elon Musk

2026年5月24日 281

原创

Hark获7亿美元Series A融资估值达60亿美元

AI硬件初创公司Hark于2026年5月21日宣布完成7亿美元Series A融资，估值60亿美元，由Parkway Venture Capital领投，Nvidia、AMD Ventures等多方跟投。创始人Brett Adcock此前创

AI融资 Hark Brett Adcock AI硬件

2026年5月24日 659

原创

安德鲁·吴批白宫绿卡新政将削弱美国AI人才竞争力

2026年5月22日，Andrew Ng在X平台发文批评白宫新绿卡政策，要求申请人从境外提交申请。他指出此举将伤害家庭、减少医生、教师和科学家数量，并损害美国在AI领域的竞争力。多位科技界人士随后跟进讨论。该政策可能加剧全球AI人才争夺，硅

AI人才移民政策 Andrew Ng 绿卡

2026年5月24日 353

测评

GPT-o3代码执行暴跌42.5分，主榜单日崩18分

GPT-o3今日Smoke评测主榜从76.05跌至58.08，代码执行从90.00直接腰斩至47.50，工程判断也从50跌到10。单日抽题波动虽属正常，但这一量级的断崖式下跌已超出随机范围，值得重点追踪。

GPT-o3 代码执行 Smoke评测模型波动

2026年5月24日 393

测评

文心一言4.5工程判断从50暴跌至10，主榜却逆涨14.5

文心一言4.5今日Smoke评测工程判断从50降至10、任务表达降20分，但材料约束暴涨24.7拉动主榜升至88.48，诚信从fail升至warn，单日抽签波动可能是主因。

文心一言4.5 工程判断 Smoke评测百度AI

2026年5月24日 297

测评

GPT-5.5 逆袭29.7分 GPT-o3 暴跌36.4分：2026 W21 Smoke 七日趋势

GPT-5.5 本周 Smoke 成绩从60.58飙升至90.3，涨幅29.7分领跑；GPT-o3 则从94.51 断崖下跌至58.08，降幅36.4分最惨。Gemini 2.5 Pro 波动61.1分暴露一致性问题，DeepSeek V4

GPT-5.5 稳定性 Smoke评测诚信评级

2026年5月24日 374

测评

GPT-o3主榜暴跌18分，豆包Pro一日暴涨35.8逆袭前五

今日Smoke轻量评测显示，GPT-o3主榜暴跌18分至58.08，执行分直接腰斩；豆包Pro、Gemini 3.1 Pro分别暴涨35.8和34.7分，快速挤入前五。GPT-5.5以90.3继续领跑，文心一言诚信评级降至warn。

GPT-o3 豆包 Pro 代码执行模型稳定性

2026年5月24日 305

原创

Qwen3.7-Max发布：代理时代旗舰模型支持35小时无干预内核优化

Qwen3.7-Max作为全新旗舰模型面向代理时代推出，支持端到端编码、多文件重构及35小时无干预内核优化任务，工具调用超1000次。API已上线供开发者测试。本文从winzheng.com Research Lab视角分析其技术原理、影响

Qwen模型 AI代理工具调用

2026年5月23日 304

原创

NVIDIA与Dell发布AI Factory更新企业AI部署加速但架构依赖风险并存

NVIDIA与Dell于5月21日前后联合发布Dell AI Factory重大更新，该全栈平台支持企业级自主AI代理，从桌面工作站延伸至数据中心机架，采用NVIDIA Vera Rubin架构。文章基于已确认事实，分析其创新点与潜在不足，

NVIDIA Dell AI Factory

2026年5月23日 296

原创

密歇根小镇否决OpenAI数据中心后遭起诉地方主权与科技扩张冲突

密歇根Saline Township以4-1投票否决OpenAI与Oracle的160亿美元数据中心项目后，开发商提起诉讼，小镇因无力应诉陷入争议。事件凸显地方主权与AI基础设施扩张的张力，需从执行与材料约束维度审视技术部署的可持续性，而非

AI数据中心地方治理科技扩张争议

2026年5月23日 312

原创