AI资讯 — 行业快报与全球报道

阿里巴巴Qwen 3.7-Max发布：价格仅Claude六分之一，AI性价比优势凸显

阿里巴巴正式推出Qwen 3.7-Max模型，以仅为Claude六分之一的价格提供强大性能，支持长达35小时自主运行和千次工具调用。该产品发布凸显中国AI在成本效益上的显著优势，引发中外模型对比热议，中文社区讨论活跃，预示全球AI竞争进入新

Qwen 3.7-Max 阿里巴巴 AI模型

2026年6月1日 319

原创

OpenAI模型破解80年前Erdős几何猜想：125页AI证明获数学界认可

OpenAI最新模型自主完成了对Erdős提出的几何猜想的证明，生成长达125页的新证明文件，并获得专业数学家的验证。这一成果被视为AI在纯数学领域的重要里程碑，展示了其通用推理能力的显著提升，在社交媒体X上引发广泛讨论。事件凸显了AI从辅

AI推理数学突破 OpenAI

2026年6月1日 254

原创

NVIDIA RTX Spark芯片震撼发布：AI代理本地推理引领PC新纪元

NVIDIA近日推出首款专为AI代理设计的RTX Spark芯片，支持在本地PC上运行强大AI模型，无需依赖云端服务。微软、Adobe等巨头合作重构软件生态，黄仁勋强调AI将创造更多工程师岗位。该产品互动量极高，标志着AI计算从云端向边缘设

Nvidia RTX Spark AI代理

2026年6月1日 535

原创

OpenAI 完成 1100 亿美元融资，估值达 7300 亿美元，IPO 传闻引发市场热议

OpenAI 近日宣布完成 1100 亿美元大规模融资，估值达到 7300 亿美元。市场传闻公司可能于年底启动 IPO，此举将用于扩展 AI 能力。融资消息在社交媒体和财经媒体广泛传播，引发关于估值泡沫与 AGI 竞赛的讨论。文章分析了此次

OpenAI 融资估值泡沫

2026年6月1日 216

原创

3大模型翻译对决：第23周质量评测，gpt-o3 以 9 分领跑

本周共翻译 270 篇文章，覆盖 3 个AI模型。经抽样盲评，gpt-o3 综合得分最高（9/10）。报告详细对比各模型在准确性、流畅性、术语一致性方面的表现差异。

翻译质量 AI模型对比 claude-sonnet-4.6 deepseek-v4-pro

2026年6月1日 256

原创

Grok图像编辑功能爆火社交平台，AI艺术创作引领病毒式传播新潮流

近期，大量用户借助Grok的图像编辑功能对名人姿势、外观等进行调整，相关帖子迅速走红，单帖获数千点赞和高浏览量。这一现象不仅展示了AI图像生成工具的流行，也反映出消费者级AI应用正迎来热度高峰。文章将深入分析这一趋势的背景、用户行为及行业影

Grok AI图像编辑病毒式传播

2026年6月1日 242

原创

Claude 动态工作流革命：Anthropic 工程师揭秘自提示代理系统新范式

Anthropic工程师近日分享Claude高级工作流实践，强调构建自提示系统而非依赖手动prompt。该方法涵盖CLADE.md配置、插件集成及多代理协作，能显著提升效率。社区讨论显示，此范式正成为AI使用新标准，相关视频与指南互动量高，

Claude AI代理提示工程

2026年6月1日 308

原创

OpenAI进军Physical AI：Sam Altman招募硬件与ML工程师，机器人时代加速到来

Sam Altman宣布OpenAI Robotics团队招聘硬件、机器学习工程师，聚焦物理世界机器人应用，从模拟研究转向硬件-ML共设计。短期支持基础设施工人，长期目标实现个人机器人，此举引发行业对Physical AI的热议。

OpenAI 机器人 Physical AI

2026年6月1日 971

测评

Smoke评测：Claude Sonnet 4.6 99.78分断层领先，GPT系列集体卡在74分

今日Smoke轻量评测显示，Claude Sonnet 4.6以主榜99.78分（执行100，约束99.5）继续领跑，DeepSeek V4 Pro与Gemini 3.1 Pro并列第二。GPT-5.5、GPT-o3、Grok 4等7个模型

Claude Sonnet 4.6 材料约束 Smoke评测主榜排名

2026年6月1日 342

原创

哈佛毕业演讲呼吁杀死AI 引发支持者反智指责与文化转向辩论

美国时间2026年5月27日，喜剧演员Ronny Chieng在哈佛毕业典礼上呼吁“你们这代使命是杀死AI”，现场获热烈掌声。该言论迅速引发两极反应：AI支持者认为其极端反智，反对者视作文化转向信号。辩论在两天内成为行业焦点，凸显公众对AI

哈佛毕业演讲 AI文化反弹科技伦理争议

2026年5月31日 1,124

原创

WDCD Run #140: Qwen3 Max Leads with 17% Instruction Decay as Average Hits 36.5%

WDCD Run #140 (2026-05-31) evaluated 11 frontier models on multi-turn commitment integrity, finding an average instructi

WDCD AI benchmark instruction decay multi-turn

2026年5月31日 222

测评

Gemini 3.1 Pro暴涨14.2分 WDCD五模型全升零下滑

本轮WDCD测试5模型全线上涨，Gemini 3.1 Pro+14.2分领跑，豆包Pro+11.7分紧随，无一下滑。Qwen3 Max仍居榜首，显示上下文约束保持能力正成新竞争焦点。

WDCD 守约测试模型更新提示敏感度

2026年5月31日 431

测评

资源限制场景全员崩盘！WDCD测试11模型平均仅1.95分

资源限制成为WDCD五大场景中最难的维度，11模型平均仅1.95分。doubao-pro在业务规则拿下3.17分，却在资源限制跌至1.33分，差距达1.84分。gemini-3.1-pro和qwen3-max在安全合规并列3.5分，展现最强

WDCD 守约测试资源限制模型偏科

2026年5月31日 370

测评

R3崩溃率高达60%！11模型WDCD三轮测试集体翻车

R1确认率96%、R2抵抗率93%，R3诚信率骤降至30.5%，200次完全崩溃。Claude在资源与安全约束下最易“嘴上答应身体诚实”，Qwen3 Max表现最稳，揭示当前对齐机制的脆弱性。

WDCD 守约测试 AI模型对齐三轮压力测试

2026年5月31日 309

测评

Qwen3 Max 70.83分称冠 WDCD守约榜 Grok4 51.67分垫底

Qwen3 Max以70.83分领跑WDCD守约榜，Grok4仅51.67分垫底；R3崩溃率60.6%，满分率仅21.2%。头部模型R3得分普遍高于0.7，尾部直接崩盘，差距集中于高压违约场景。

WDCD 守约测试 AI模型评测守约能力分析

2026年5月31日 333

原创

Groq推进新一轮融资与Nvidia合作扩展AI推理云服务

Groq公司正积极寻求新一轮融资，同时与Nvidia展开合作以扩展其AI推理云服务。此举标志着AI芯片领域竞争进一步加剧，吸引了市场广泛关注。分析人士认为，这将推动推理计算基础设施的创新与发展，对整个AI生态系统产生深远影响。

Groq融资 Nvidia AI推理

2026年5月31日 230

原创

Figure 03人形机器人突破200小时连续运行具身智能迈向规模化应用

Figure公司最新人形机器人Figure 03成功实现200小时不间断运行，这一技术突破标志着具身智能从实验室展示阶段转向规模化应用。文章分析其技术原理、行业影响及未来挑战，探讨机器人与AI深度融合对制造业、服务业的潜在变革。

Figure 03 人形机器人具身智能

2026年5月31日 787

原创

中国三体计算星座建成全球首个太空AI算力平台上线

全球首个整轨互联太空计算星座正式建成，在轨算力达到5P OPS，可支持1400亿参数模型运行。目前已部署11个AI模型，包括最大天基遥感模型，实现模型在轨部署与更新。这一突破标志着中国在太空计算领域取得重大进展，为未来卫星互联网和空间智能应

太空AI 三体计算星座卫星算力

2026年5月31日 224

原创

2026全球AI算力报告发布：芯片多元演进与绿色集群引领新格局

天津博览会发布《2026全球AI算力报告》，指出AI芯片正从GPU向TPU、NPU多元演进，算力中心迈入超大规模绿色集群阶段。报告强调AI工作站与服务器升级将支撑词元经济及国家战略布局，十大趋势涵盖能效优化、边缘计算融合及国际合作等，为全球

AI算力 AI芯片全球趋势

2026年5月31日 4,789

原创

中国AI产业2026转折：超6000家企业与1.2万亿规模引领智能新时代

2026世界智能产业博览会发布《新一代人工智能科技产业发展报告2026》，显示中国AI企业超6000家，核心产业规模突破1.2万亿元。报告指出2026年为产业转折年，大模型、智能体与具身智能加速落地，信息智能与物理智能边界逐渐打破。本文深入

中国AI报告智能经济具身智能

2026年5月31日 6,853

原创