AI资讯 — 行业快报与全球报道

NVIDIA H200供不应求爆单超预期3倍！垄断指控中美观点撕裂，中国AI命脉何去何从？

NVIDIA 3月财报数据中心营收暴增，H200芯片供不应求引发垄断指控。中美舆论对立：美媒视作市场自然，中文圈斥美封锁。本文剖析深层原因——AI多模态训练内存饥渴与台积电产能倾斜，评估中国国产替代路径，winzheng.com认为短期NV

NVIDIA AI芯片垄断争议地缘政治

2026年3月28日 860

原创

AlphaFold 3：AI引领生物医学革命，预测动态蛋白质相互作用

谷歌DeepMind发布的AlphaFold 3被誉为生物医学界的'GPT-3时刻'，因其能够成功预测蛋白质与药物分子的动态相互作用。这一突破引发科学界和制药公司的高度关注，尽管商业化进程尚不明确，但其在AI与生物医药结合的可能性上展示了巨

AI 生物医学 DeepMind

2026年3月27日 417

原创

DeepSeek V3 671B参数全开源！安全专家怒斥军备竞赛风险，中国AI再掀全球风暴

DeepSeek V3以671B参数规模全面开源，GitHub仓库瞬间爆火，TechCrunch和36氪报道引发安全辩论。开源社区赞其民主化AI，中外观点对立：安全组织警告军备竞赛隐患。本文剖析争议深层地缘张力，强调技术贡献与风险平衡，wi

DeepSeek-V3 AI开源安全风险

2026年3月25日 627

原创

AlphaFold 4精准破解癌症关键蛋白3D结构，自然验证股价暴涨，为何从预测到药物仍需10年？

Alphabet旗下Isomorphic Labs的AlphaFold 4成功预测并验证癌症相关关键蛋白质三维结构，成果登上《自然》杂志，引发生物科技股波动。科学界赞为AI生命科学里程碑，投资者乐观，患者期待。但unconfirmed核验状

AI AlphaFold 癌症研究生物科技

2026年3月25日 517

测评

11个AI模型周测：GPT-4o材料约束暴跌10分，国产文心逆势上涨

赢政指数第13周评测显示，GPT-4o材料约束维度大跌10.3分，成为本周最大输家；文心一言4.0代码执行提升6.8分，是唯一在主榜核心维度上涨的模型。豆包Pro稳居榜首，GPT-4o跌至垫底。

GPT-4o 文心一言材料约束代码执行

2026年3月24日 684

测评

豆包Pro稳定性暴跌19.8分，同题不同答成最大软肋

赢政指数最新评测显示，豆包Pro稳定性从54.5分骤降至34.7分，跌幅达19.8分。这意味着模型在回答同类题目时表现出严重的不一致性，同样的问题可能得到截然不同的答案，这对需要稳定输出的生产环境构成重大隐患。

豆包Pro 稳定性模型一致性评测分析

2026年3月24日 756

原创

美国政府AI采购新规引爆硅谷：大厂叫好，95%初创公司恐被踢出局

美国总统签署行政命令，要求联邦机构采购AI系统必须遵循NIST框架并提供透明度报告。科技巨头表示支持，但小型AI初创公司担忧合规成本将导致市场集中化，可能重塑全球AI产业格局。

AI治理政府采购合规成本市场垄断

2026年3月24日 469

原创

AlphaFold 3横空出世：AI预测蛋白质动态交互准确率达90%，制药巨头股价暴涨15%

DeepMind最新发布的AlphaFold 3实现了从静态到动态的关键突破，能够以90%以上的准确率预测蛋白质与药物分子的动态相互作用。这一里程碑式进展引发全球生物医药板块集体上涨，多家制药巨头股价涨幅超过15%，但实际应用落地仍面临诸多

AlphaFold DeepMind 蛋白质折叠药物研发

2026年3月24日 472

测评

Grok 3 稳定性暴跌 22.5 分：当 AI 遇到真实工程场景就露馅了

Grok 3 在最新评测中稳定性得分暴跌 22.5 分至 31.7 分，在需要工程经验和实际判断的题目上全面失守。编程能力虽涨 42.4 分，但遇到真实故障场景时的表现令人担忧。

Grok 3 稳定性测试工程判断力 AI评测

2026年3月22日 866

测评

GPT-o3崩了：31分暴跌背后的致命缺陷

GPT-o3本周可用性暴跌31分，从满分跌至69分。长上下文能力崩盘33.5分，稳定性下降25分。编程能力虽提升23分，但在关键生产场景的表现令人担忧。这不是普通的性能波动，而是架构级的系统性问题。

GPT-o3 可用性测试模型稳定性长上下文处理

2026年3月22日 710

测评

GPT-o3崩了：不是性能波动，背后的架构级的系统性崩塌

GPT-o3本周稳定性暴跌25分，可用性从100%跌至69%，长上下文能力崩塌33.5分。深度分析显示，这不是简单的性能波动，而是暴露了其架构设计的根本性缺陷。当AI遇到真实工程场景，华丽的benchmark分数瞬间现形。

GPT-o3 稳定性测试模型架构性能退化

2026年3月22日 635

测评

GPT-o3崩了：30秒限流5次，长文本评测暴跌33.5分

GPT-o3在最新评测中遭遇滑铁卢：长上下文得分暴跌33.5分，5道关键题目全部因API限流失败。原始日志显示30秒内触发5次限流，暴露出OpenAI基础设施的严重短板。

GPT-o3 长上下文 API限流模型稳定性

2026年3月22日 654

测评

GPT-4o崩了：35分暴跌背后的严格模式陷阱

GPT-4o本周可用性暴跌35分，在严格工具调用测试中全军覆没。当AI被要求"只在确定时才行动"，它选择了完全不行动。这暴露出当前大模型在处理不确定性时的根本缺陷。

GPT-4o 可用性测试严格模式工具调用

2026年3月22日 582

测评

豆包Pro稳定性大幅下滑背后的技术隐患

豆包Pro本周稳定性得分暴跌19.8分至34.7分，成为所有维度中唯一负增长指标。通过分析失分题目发现，模型在处理复杂推理、数学计算和代码生成任务时出现明显退化，暴露出可能的模型更新或系统调整问题。

豆包Pro 稳定性测试 AI评测模型性能

2026年3月22日 1,280

测评

GPT-4o崩了：5道题全军覆没暴露OpenAI基础设施问题

GPT-4o在最新评测中遭遇灾难性崩盘：长上下文得分暴跌21.9分，5道关键题目因API限流全部返回错误，可用性从100%跌至65%。这不是模型能力问题，而是OpenAI基础设施已经撑不住了。

GPT-4o 长上下文 OpenAI基础设施 API限流

2026年3月22日 592

测评

Gemini 2.5 Pro崩了：稳定性暴跌23分背后的工程判断力不足

Gemini 2.5 Pro本周稳定性评分从54分暴跌至31.2分，跌幅达22.8分。深度分析显示，该模型在面对严格测试题时出现系统性失败，暴露出Google在追求性能提升时对工程判断力的忽视。

Gemini 2.5 Pro 模型稳定性 Google AI 工程判断力

2026年3月22日 830

测评

文心4.0稳定性暴跌22分：百度AI在关键时刻为何总掉链子

文心一言4.0在最新评测中稳定性得分暴跌22.1分至30分，成为所有维度中唯一负增长指标。深度分析显示，该模型在处理复杂推理、数学计算等关键任务时表现出严重的不稳定性，暴露出百度在AI工程化能力上的致命短板。

文心一言4.0 稳定性测试百度AI 模型可靠性

2026年3月22日 2,250

测评

Qwen Max稳定性暴跌22.8分：模型更新引发输出质量波动

Qwen Max本周评测稳定性维度大幅下跌22.8分，从53.0降至30.2。尽管编程和长上下文能力显著提升，但在多个基础任务上出现严重质量问题，疑似模型版本更新导致的不稳定现象。

Qwen Max 稳定性测试 AI评测模型更新

2026年3月22日 574

测评

Gemini 2.5 Pro稳定性断崖式下跌背后的技术隐患

Gemini 2.5 Pro本周稳定性评分暴跌22.8分至31.2分，成为其最大短板。通过分析具体失分案例，发现模型在基础认知、逻辑推理和指令遵循等多个维度出现系统性退化，可能与模型更新或服务端调整有关。

Gemini 模型稳定性性能评测 AI安全

2026年3月22日 1,249

测评

DeepSeek R1稳定性暴跌22分：简单判断题全军覆没的真相

DeepSeek R1在最新测试中稳定性得分暴跌22.1分至31.6分，在基础逻辑判断题上出现离谱错误。尽管编程能力飙升47.4分，但在判断"水能否烧到101度"这种常识问题上竟然失误，暴露出严重的推理一致性问题。

DeepSeek R1 稳定性测试 AI推理失败模型退化

2026年3月22日 519