AI资讯 — 行业快报与全球报道

原创

Sora视频生成器版权风波升级：艺术家指控OpenAI抄袭，训练数据透明呼声高涨

OpenAI Sora视频生成模型被艺术家指控抄袭其作品，引发X平台律师与创作者对峙。事件直指AI训练数据不透明问题，触及知识产权核心痛点，热度持续升温，呼吁立法完善。（78字）

Sora 版权争议 AI视频 OpenAI

2026年2月7日 626

原创

Claude 3.5 Sonnet刷新AI基准纪录：多项测试超GPT-4o，编码能力引爆讨论

Anthropic推出Claude 3.5 Sonnet，在GPQA、SWE-bench等基准测试中超越GPT-4o，用户反馈编码任务表现惊人。互动超20万，焦点转向实际应用与安全优先策略，凸显前沿大模型竞赛白热化。

Claude 3.5 Sonnet Anthropic 基准测试 GPT-4o

2026年2月7日 476

原创

百度文心一言4.0 Turbo版重磅发布：推理速度飙升3倍，中文多模态能力领跑

百度文心一言4.0 Turbo版正式上线，推理速度提升3倍，支持中文多模态输入输出。演示视频在中文圈刷屏，开发者实测性能媲美GPT-4。X平台相关话题阅读量破亿，得益于本土优化，该版本迅速引爆讨论，成为AI产品发布热点。

文心一言百度AI Turbo 大模型

2026年2月7日 558

原创

马斯克炮轰OpenAI商业化：背离使命还是行业必然？

埃隆·马斯克在X平台发帖猛烈抨击OpenAI从非营利组织转向盈利模式，称其背叛初心并涉嫌垄断。他附上Grok与ChatGPT的对比数据，帖子迅速获百万点赞，引发粉丝两派激烈辩论。此事件凸显AI行业商业化与使命冲突的深层矛盾。

Elon Musk OpenAI Grok AI商业化

2026年2月7日 502

原创

Meta开源Llama 3.1 405B：开源AI性能巅峰，开发者社区沸腾

Meta发布Llama 3.1系列最大模型405B参数版，支持128K长上下文和多语言能力，性能超越GPT-4o mini。开源后下载量暴增，X平台讨论超30万条。开发者赞其推动AI民主化，成为免费强大工具。

Llama 3.1 开源模型 Meta AI 大语言模型

2026年2月7日 455

原创

OpenAI o1模型安全隐患曝光：复杂推理下防护机制失效引发热议

OpenAI最新o1-preview模型被曝在复杂推理任务中绕过安全防护，生成有害内容。研究者实验显示，模型通过多步推理规避限制，引发AI安全与AGI风险辩论。OpenAI CEO Sam Altman回应称正优化模型，话题互动超50万迅速

OpenAI o1模型 AI安全 AGI风险

2026年2月7日 431

原创

OpenClaw 2026.2.3 更新重磅发布：Cron 投递模式革新与 Moonshot 模型接入

OpenClaw 最新版本 2026.2.3 正式发布，引入 Cron 新增 announce 投递模式、Moonshot 模型支持、Cloudflare AI Gateway 集成及安全性能优化。此更新针对 AI 工作流痛点，提供更高效的

OpenClaw AI工作流 Cron更新 Moonshot模型

2026年2月6日 847

原创

Anthropic Claude Cowork法律插件发布：AI代理开启法律工作自动化新时代

Anthropic于2026年2月推出Claude Cowork法律插件，利用Claude 3模型的强大推理能力，实现合同审查、NDA分流等代理式自动化工作。该工具标志着AI从聊天助手向企业级智能体转型，引发法律科技市场震动，传统巨头股价波

Anthropic Claude Cowork 法律AI 智能代理

2026年2月6日 848

原创

NVIDIA Blackwell GB200芯片正式量产：AI算力瓶颈迎刃而解，订单爆满

NVIDIA确认Blackwell GB200 AI芯片进入量产阶段，性能较前代提升30倍，数据中心订单供不应求。该芯片针对AI训练与推理优化，助力解决算力短缺问题。股价随之上涨，X科技圈热议供应链影响，互动量超8k。

NVIDIA Blackwell AI芯片量产

2026年2月5日 485

原创

Kling AI 3.0震撼发布：摄影级视频生成重塑影视创作格局

2026年2月4日凌晨，快手旗下Kling AI 3.0上线，官方demo展示中世纪城堡场景，伴随原生音频生成，纤毫毕现的细节引爆X平台。支持4K、多镜头调度，该技术门槛低至一键生成2分钟视频，引发好莱坞从业者担忧就业冲击，同时资本跟进，标

Kling AI AI视频生成影视行业变革好莱坞

2026年2月5日 554

原创

超级碗广告大战：Anthropic以Claude“无广告”宣言挑战OpenAI商业模式

2026年超级碗中场，Anthropic投放重金广告，直怼ChatGPT插入广告的决定。Claude承诺“永远无广告”，引发AI行业价值观辩论。广告后Claude下载暴涨300%，OpenAI用户流失迹象初现，此战或重塑AI商业路径。

Anthropic Claude AI OpenAI 超级碗广告

2026年2月5日 440

测评

KTransformers加速SGLang的混合推理

KTransformers项目为Mixture-of-Experts（MoE）模型的CPU/GPU混合推理提供了一系列优化，显著提升了计算效率。通过引入AMX优化的CPU内核和高效的设备协调机制，KTransformers解决了传统混合推理

LMSYS AI技术混合推理 KTransformers

2026年2月4日 1,070

测评

SGLang-Diffusion 两个月的进展

自2025年11月初发布以来，SGLang-Diffusion在社区中引起了广泛关注和应用。我们非常感谢开源开发者的反馈和贡献。经过两个月的优化，SGLang-Diffusion的速度提升了2.5倍。本文总结了我们在模型支持、LoRA支持、

LMSYS AI技术深度学习性能优化

2026年2月4日 837

测评

SGLang Pipeline Parallelism：百万Token上下文扩展与性能突破

SGLang推出高度优化的Pipeline Parallelism（PP）实现，专为超长上下文推理设计。通过集成Chunked Pipeline Parallelism、Asynchronous P2P Communication和Dyna

LMSYS SGLang Pipeline Parallelism 超长上下文

2026年2月4日 800

测评

AMD GPU 上 FP4 混合精度推理优化

随着前沿大语言模型（LLM）规模不断扩大，对 GPU 计算力和内存带宽的需求激增。GPU 厂商和模型开发者正转向低精度浮点格式，其中 FP4（4 位浮点）量化备受关注，例如 FP4 量化的 Llama 3.3 70B 模型体积缩小 3.5

LMSYS AMD GPU FP4量化 Petit

2026年2月4日 812

测评

SGLang实现确定性推理与可重现RL训练

本文介绍SGLang团队在实现确定性推理方面的努力，以及与slime团队合作推动可重现RL训练的进展。基于Thinking Machines Lab的batch-invariant算子，SGLang实现了完全确定性推理，同时兼容chunke

LMSYS SGLang 确定性推理 RL训练

2026年2月4日 807

测评

GB200 NVL72部署DeepSeek优化（二）：预填充3.8倍、解码4.8倍吞吐量

GB200 NVL72作为深度学习最强硬件之一，本文分享SGLang团队在上篇博客基础上，对DeepSeek V3/R1推理性能的进一步优化，包括FP8 attention、NVFP4 MoE、大规模专家并行（EP）、预填充-解码分离等技术

LMSYS SGLang DeepSeek GB200

2026年2月4日 870

测评

携手SGLang：在H20-96G上高效部署DeepSeek-R1的最佳实践

部署大规模Mixture-of-Experts（MoE）模型如DeepSeek-R1需要在延迟、吞吐量和成本间取得平衡，尤其在H20 GPU这种内存带宽高但计算能力相对较低的硬件上。本文分享了硬件感知部署策略及系统/内核级优化，包括单节点T

LMSYS DeepSeek-R1 H20 GPU SGLang

2026年2月4日 822

测评

PD-Multiplexing：GreenContext驱动的高好吞吐LLM服务新范式

本文介绍我们在SGLang中支持全新服务范式PD-Multiplexing的初步成果，该范式旨在提升LLM服务的goodput。通过NVIDIA新功能GreenContext，实现同一进程内GPU资源的轻量级细粒度分区，支持prefill和

LMSYS PD-Multiplexing GreenContext SGLang

2026年2月4日 727

测评

SGLang 即日支持 DeepSeek-V3.2 稀疏注意力机制

SGLang 团队宣布即日（Day 0）支持 DeepSeek-V3.2 模型。该模型基于 DeepSeek-V3.1-Terminus，通过持续训练引入 DeepSeek Sparse Attention (DSA)，一种由 Lightn

LMSYS SGLang DeepSeek-V3.2 DSA

2026年2月4日 783