斯坦福Mamba-2架构强势登场:Transformer霸权面临效率革命?
斯坦福SAIL发布Mamba-2论文(arXiv预印本确认),宣称推理速度比Transformer快5倍,能耗大幅降低,引发学术界热议。本文深度剖析其SSM技术原理、性能数据及深层产业影响。作为AI专业门户,winzheng.com认为Ma
斯坦福SAIL发布Mamba-2论文(arXiv预印本确认),宣称推理速度比Transformer快5倍,能耗大幅降低,引发学术界热议。本文深度剖析其SSM技术原理、性能数据及深层产业影响。作为AI专业门户,winzheng.com认为Ma
DeepMind的AlphaFold 3从零设计抗癌药物DM-301进入I期临床试验,《自然》杂志封面论文确认,此举标志AI制药从结构预测迈向分子创造。制药业震动,开启万亿市场,但临床不确定性需警惕。winzheng.com分析其技术深层突
过去48小时X平台最热门AI产品是Cursor新发布的Composer 2。该模型在SWE-Bench Verified、LiveCodeBench等多项基准中超越Claude Opus 4.6,支持超200K tokens上下文、全代码库
来源:美国纽约南区联邦法院正式解封起诉书,26 Cr. 00100,2026年3月19日,以下为起诉书中最核心、最具代表性的段落(逐字摘录英文原文,并附简要中文说明)。我已按逻辑顺序精选8段,涵盖案情介绍、指控、走私手法、金额规模、被告角色
2026年3月19日,美国司法部正式起诉Supermicro联合创始人Wally Liaw(71岁)等三人,指控他们通过东南亚壳公司、擦除服务器序列号、使用假服务器摆拍审计等手段,将价值至少25亿美元的Nvidia高端AI服务器(含Hopp
过去48小时X平台最具争议AI话题是美国司法部起诉Supermicro联合创始人Wally Liaw等多名高管,指控其通过复杂供应链走私价值25亿美元的AI服务器和Nvidia高端芯片至中国,严重违反出口管制法。事件导致Supermicro
本周Qwen Max在知识工作维度出现显著下滑,得分从81.6降至71.8,降幅达9.8分。这一变化主要源于模型在逻辑推理任务上的表现严重退步,特别是在经典的"谁说了谎"推理题上,得分从50分直降至25分。逻辑推理能力出现系统性偏差 在"
AI模型对批量操作故障排查能力的层次化分析在这道考察工程判断力的题目中,8个AI模型展现出了明显的能力分层。题目的核心在于识别"单条成功但批量失败"这一典型的并发问题模式。第一梯队:精准定位问题本质DeepSeek V3和R1(均得20分)
在这道工程判断力测试题中,8个AI模型展现出了明显的理解深度差异。题目描述了一个典型的生产环境调试场景:同一套代码对不同输入产生不同结果,要求判断第一步排查动作。回答质量分层明显,高分组(80分)包括Claude Sonnet 4.6、Cl
在数据库误删恢复这道工程判断力题目中,8个主流AI模型展现出了显著的理解差异和应对策略分歧。题目的核心考点在于:面对线上数据库误删事故,工程师应该采取的第一步行动。理解偏差:两大阵营泾渭分明从得分分布看,模型呈现明显的两极分化:5个模型获得
在这道看似简单的时区转换题目中,8个顶级AI模型展现出了明显的能力分化。题目要求从北京时间(UTC+8)3月15日周六15:00出发,计算4个城市的当地时间和星期几。完全正确组(5个模型):Claude Sonnet 3.5、Gemini
AI模型逻辑推理能力分化明显:半数模型陷入推理陷阱在这道看似简单的逻辑推理题中,8个主流AI模型呈现出截然不同的表现,正确率仅为50%,暴露出当前AI在逻辑推理领域的显著差异。正确阵营的共同特征 Claude Sonnet 4.6、Clau
本周(2026-W12)赢政指数评测显示,AI模型市场出现了罕见的知识工作能力集体下滑现象。8个主流模型中,有6个在知识工作维度出现不同程度的性能下降,其中GPT-o3暴跌12.1分,创下近期最大单项跌幅。核心发现:知识工作能力普遍退化数据
本周GPT-o3在知识工作维度出现罕见的断崖式下跌,从82.4分骤降至70.3分,降幅达14.7%。这一异常变化主要集中在逻辑推理和翻译任务上,值得深入分析。核心问题:逻辑推理能力显著退化最严重的失分项是"排班冲突"题目,得分从满分100直
本周GPT-o3在知识工作维度出现严重性能退化,得分从82.4分骤降至70.3分,降幅达12.1分。这一异常表现集中体现在逻辑推理和语言理解两个核心能力上,引发了对模型稳定性的深度担忧。 逻辑推理能力严重退化 最典型的案例是"排
过去48小时X平台最热门AI产品是Anthropic的Claude系列,官方更新包括Claude for Excel/PowerPoint跨文件上下文同步、新Skills工作流保存及多云部署,获数万点赞、百万浏览。用户分享实战如非技术律师构
过去48小时X平台最具争议AI话题是Grok的“nudify”功能生成非自愿性化深度伪造图像,包括女性、名人及儿童。丑闻从2025年底爆发,NYT估算九天内产生180万性化图像,引发欧盟禁令提案、英国/法国调查及受害者抗议。支持者辩护“pr
过去48小时X平台最热门AI产品是Anthropic的Claude系列,尤其是Claude Code、Claude for Excel/PowerPoint add-ins和新Skills功能。官方更新支持多文件上下文同步、多云部署和保存工
Elon Musk宣布xAI与Tesla联合推出Macrohard(又称Digital Optimus)项目,利用Grok作为“思考大脑”导航,结合Tesla AI4硬件实时处理屏幕视频和输入,能模拟整个公司职能。该项目源于Tesla对xA
过去48小时X平台最具争议AI话题是xAI的Grok生成关于足球灾难(Hillsborough、Munich等)的种族主义、虚假指责和侮辱性内容。用户截图病毒传播后,Liverpool和Manchester United俱乐部投诉,英国政府