据多家权威媒体报道,英伟达(NVIDIA)正针对中国市场研发一款名为B30的降规版 AI 芯片,其核心亮点是首次支持多 GPU 扩展功能,试图在出口管制背景下重新打开中国市场。以下是基于现有信息的详细解析:
![图片[1]-英伟达为中国市场研发B30降规版AI芯片,首度支持多GPU扩展-赢政天下](https://www.winzheng.com/wp-content/uploads/2025/06/20250604101855875-image.png)
一、技术特性与定位
-
架构与制程
B30 采用英伟达最新的Blackwell 架构,但在关键技术上做出妥协:- 显存配置:使用 GDDR7 显存替代高频宽内存(HBM),带宽预计约 1.7TB/s,显著低于 H20 的 4.0TB/s。
- 封装工艺:未采用台积电先进封装技术,成本降低但可能影响芯片集成度和能效比。
- 核心设计:基于 GB20X 芯片(与 RTX 50 系列同源),售价在 6500-8000 美元之间,较 H20 的 1 万 – 1.2 万美元更具价格竞争力。
-
多 GPU 扩展技术
B30 的 “多 GPU 扩展” 能力引发业界关注,但具体实现方式存在多种推测:- NVLink 的可能性:英伟达已在消费级 GPU 中取消 NVLink 支持,但 B30 可能通过改良 GB202 芯片(RTX 5090 同款)重新启用该技术。
- ConnectX-8 SuperNICs 技术:更可能的方案是采用英伟达在 Computex 2025 展示的 ConnectX-8 SuperNICs 技术,该技术通过集成 PCIe Gen6 交换机和高速网络,支持多 GPU 低延迟互联,曾用于连接 RTX Pro 6000 GPU。
- 性能对比:若采用 ConnectX-8,其互联带宽和延迟可能不及 H20 的 NVLink(900GB/s),但能满足中小规模集群需求。
-
算力与应用场景
尽管具体算力参数未公开,但作为降规版芯片,B30 的单卡性能预计低于 H20(FP8 算力 296 TFLOPS)。其核心优势在于通过多 GPU 扩展提升整体算力,适合对成本敏感但需扩展性的场景,如中小规模 AI 推理、边缘计算等。
二、市场策略与政策背景
-
应对出口限制的产物
美国对华 AI 芯片出口管制趋严,英伟达需通过调整设计维持中国市场份额。B30 的降规设计(如取消 HBM、限制互联带宽)旨在符合监管要求,同时保留多 GPU 扩展功能以满足客户需求。 -
与国产芯片的竞争
与华为昇腾 910B 相比,B30 在显存容量上占优(GDDR7 vs 昇腾 910B 的 HBM2e),但能效比可能处于劣势(昇腾 910B 功耗 310W,B30 未披露)。昇腾 910B 的单卡价格约 1.7 万美元,略高于 B30,但具备国产供应链优势。 -
生态与合作伙伴
英伟达计划通过NVLink Fusion技术开放生态,允许第三方 CPU 与 GPU 互联,但 B30 是否支持该技术尚未明确427。目前中国市场的具体合作伙伴及应用案例仍待披露,推测可能与阿里云、腾讯云等云计算厂商合作。
三、行业影响与挑战
-
性能与成本的平衡
B30 的多 GPU 扩展能力能否弥补单卡性能不足,取决于实际应用场景。例如,在需要高带宽的垂类模型训练中,H20 仍具优势;而在中小规模推理任务中,B30 的性价比可能更突出。 -
技术替代风险
若 B30 依赖 ConnectX-8 而非 NVLink,其多 GPU 性能可能受限于网络延迟,长期可能面临国产 DPU(数据处理单元)的竞争。 -
政策不确定性
美国出口管制政策的进一步收紧可能迫使英伟达再次调整 B30 规格,甚至影响其市场准入。
四、总结
B30 的推出是英伟达在技术与政策夹缝中寻求生存的关键举措,其核心价值在于通过多 GPU 扩展提供灵活的算力解决方案。尽管单卡性能受限,但其价格优势和扩展性可能吸引对成本敏感的中国客户。未来需关注两点:一是 B30 的实际性能表现是否符合预期,二是英伟达能否通过生态合作(如 NVLink Fusion)强化竞争力。若 B30 成功打开市场,可能为其他厂商提供应对出口限制的参考范式。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容