头条推荐

OpenAI解决80年数学难题?这次数学家为其背书

OpenAI宣称其推理模型成功证伪了一个自1946年以来悬而未决的几何猜想。与上次闹出笑话的虚假宣称不同,这次当初揭露其错误的数学家们竟然站出来为其背书。这一突破标志着AI在数学推理领域迈出了坚实一步,也引发了关于AI能否真正理解和证明数学定理的激烈讨论。

TC 31分钟前 11 阅读
继续阅读

赢政指数看板

查看完整排行 »
综合排行 Top 5
  1. 1 Claude Sonnet 4.6 83.0
  2. 2 豆包 Pro 81.3
  3. 3 Grok 4 81.0
  4. 4 Claude Opus 4.7 80.0
  5. 5 Gemini 2.5 Pro 79.0
WDCD 守约 Top 5
  1. 1 Claude Opus 4.7 65.0%
  2. 2 Claude Sonnet 4.6 62.5%
  3. 3 豆包 Pro 60.0%
  4. 4 Gemini 2.5 Pro 57.5%
  5. 5 Qwen3 Max 57.5%
本周动态
  • Qwen3 Max -10.0分
  • GPT-o3 -10.8分
  • GPT-5.5 -19.2分
  • Gemini 3.1 Pro -8.3分
  • GPT-o3 严格题"SQL:连续登录天数"从满分
  • GPT-o3 严格题"Debug:矩阵旋转"从满分

Lab 原创

更多评测

最新资讯

查看全部
TC

Anthropic每月向xAI支付12.5亿美元算力费

埃隆·马斯克旗下的xAI与Anthropic达成一项令人意外的算力销售协议,如今具体金额浮出水面:Anthropic将每月向xAI支付12.5亿美元,以获得其超级计算机集群的算力支持。这笔交易不仅缓解了Anthropic对算力的迫切需求,也标志着xAI从纯AI研究公司向算力供应商的角色转变。在AI军备竞赛白热化的当下,这样的合作与竞争交织的格局正在重塑整个行业。

AI算力 Anthropic xAI
32分钟前 11
TC

马斯克xAI因数据中心发电机被诉,却再砸28亿美元采购

马斯克旗下AI公司xAI正面临法律诉讼,指控其数据中心发电机造成环境污染。然而,据SpaceX IPO文件透露,xAI计划未来三年再购买28亿美元的天然气涡轮机,以支撑其AI算力扩张。这一巨额投资引发环保争议,批评者认为此举与马斯克宣扬的可持续理念背道而驰。本文深度解析诉讼背景、xAI的能源策略及行业连锁反应。

xAI 马斯克 数据中心
33分钟前 11
ARS

2026年谷歌I/O:AI智能体将彻底重塑搜索

在2026年谷歌I/O开发者大会上,公司宣布了搜索历史上最大规模的变革:全面转向智能体驱动(Agentic AI)的搜索架构。新系统不再仅返回链接,而是能够理解复杂意图、主动规划多步骤任务、调用第三方服务并生成可执行的解决方案。这一转变标志着搜索从信息检索工具进化为自主行动的虚拟助手,也引发了关于隐私、垄断和AI安全的新一轮讨论。

谷歌I/O 智能体搜索 Agentic AI
4小时前 18