- 1 Claude Sonnet 4.6 83.0
- 2 豆包 Pro 81.3
- 3 Grok 4 81.0
- 4 Claude Opus 4.7 80.0
- 5 Gemini 2.5 Pro 79.0
陪审团裁定:马斯克起诉OpenAI时机过晚
在一场备受瞩目的诉讼中,陪审团一致认为埃隆·马斯克起诉OpenAI过于拖延,法官随即确认了该裁决。马斯克指控OpenAI背离非营利初衷,但法律上已超诉讼时效。此案引发对AI治理和创始人责任的广泛讨论,马斯克已表示将提起上诉。
继续阅读赢政指数看板
查看完整排行 »- 1 GPT-5.5 71.7%
- 2 Qwen3 Max 67.5%
- 3 Claude Opus 4.7 66.7%
- 4 GPT-o3 65.8%
- 5 Gemini 2.5 Pro 64.2%
- ↓ Gemini 2.5 Pro -5.0分
- ↓ 豆包 Pro -5.7分
- ↑ Claude Sonnet 4.6 +8.2分
- ↑ GPT-o3 +18.1分
- ⚠ GPT-o3 严格题"SQL:连续登录天数"从满分
- ⚠ GPT-o3 严格题"Debug:矩阵旋转"从满分
Lab 原创
更多评测最新资讯
查看全部陪审团裁定:马斯克起诉OpenAI时机过晚
在一场备受瞩目的诉讼中,陪审团一致认为埃隆·马斯克起诉OpenAI过于拖延,法官随即确认了该裁决。马斯克指控OpenAI背离非营利初衷,但法律上已超诉讼时效。此案引发对AI治理和创始人责任的广泛讨论,马斯克已表示将提起上诉。
Anthropic收购OpenAI同款开发者工具公司Stainless
AI安全公司Anthropic宣布收购纽约初创公司Stainless,后者曾为OpenAI、Google和Cloudflare等科技巨头提供API管理工具。作为交易的一部分,Stainless将逐步关闭其所有托管产品。此次收购将帮助Anthropic强化开发者工具链,加速安全AI应用的部署。业界分析认为,此举反映了AI基础设施领域整合加速的趋势。
揭秘Anduril与Meta联手打造军用AR眼镜:眼球追踪指挥无人机
防务科技公司Anduril与Meta合作,正为美军原型开发一款增强现实(AR)头显。该设备可通过眼球追踪和语音命令直接指挥无人机攻击。项目负责人、前陆军特种作战司令部军官Quay Barnett透露了更多细节,标志着军用智能眼镜迈向实战化。本文编译自MIT Technology Review。
重要信号:MIT内幕小组探讨AI关键趋势
在MIT技术评论举办的专家小组讨论中,多位业内领袖围绕AI领域最值得关注的信号展开深度对话。从技术突破到伦理边界,从资本流向到监管演变,他们剖析了那些预示未来格局变化的微弱但关键的趋势。本文编译自小组讨论的核心观点,并结合行业背景提供编者分析。
马斯克诉OpenAI案败诉,陪审团裁定诉讼超期
马斯克起诉OpenAI及其联合创始人奥特曼一案近日在美国加州法院宣判,九人陪审团一致裁定马斯克的诉讼提起过晚,已超出法定时效。马斯克声称被共同创始人欺骗和虐待,但法院未支持其主张。该案涉及AI行业竞争格局、OpenAI从非营利转向营利以及马斯克与奥特曼的恩怨。马斯克此前多次起诉,均未成功。
谷歌I/O前瞻:AI竞赛中如何逆袭?
谷歌即将召开年度开发者大会I/O,但在基础模型竞赛中已滑至第三位。本文将回顾谷歌AI战略的曲折历程,分析其与OpenAI、Meta的差距,并前瞻大会可能发布的新模型Gemini 2.0、多模态AI助手及硬件生态升级。
马斯克诉OpenAI里程碑案败诉:九人陪审团两小时裁决
在长达两年的法律拉锯战后,埃隆·马斯克对OpenAI提起的标志性诉讼于周一尘埃落定。由九名成员组成的陪审团仅用两小时便一致裁定OpenAI胜诉,法官迅速采纳为最终判决。此案聚焦于OpenAI是否违背非营利初衷、与微软的商业合作是否构成利益冲突,以及AI技术发展方向应由谁掌控。法律界人士认为,这一裁决或将重塑AI行业的治理模式与开源生态。
亚马逊Alexa+推出AI播客生成功能
亚马逊宣布其升级版语音助手Alexa+新增AI播客生成功能,用户只需简单指令即可获得根据个人兴趣定制的播客节目。这一功能标志着Alexa从传统语音助手向个性化AI内容平台的转型,也反映了科技巨头在AI音频生成赛道的激烈竞争。
指甲盖大小的透镜,韩国LetinAR或成AI眼镜光学支柱
韩国创业公司LetinAR开发了一款仅有缩略图大小的光学透镜,有望成为AI眼镜时代的光学核心。该技术采用独特的“针孔镜”设计,解决了传统AR眼镜体积大、视场角窄的痛点,同时支持全彩高分辨率显示。随着Meta、苹果等巨头布局AI眼镜,轻量化的光学方案成为竞争关键。LetinAR已获得多家风险投资,并与头部厂商展开合作,或将在未来智能眼镜市场中占据关键一环。
马斯克与奥特曼庭审第三周:信誉之战,陪审团将定夺
马斯克与阿尔特曼的庭审进入第三周,双方在法庭上就彼此的可信度展开激烈交锋。争议焦点在于OpenAI从非营利组织转向营利性结构的合法性,以及马斯克主张其早期贡献被忽视。如今案件交由陪审团裁决,这不仅关乎两位科技巨头的个人名誉,更可能重塑人工智能行业的治理格局。
AI生成漏洞报告泛滥,企业漏洞赏金计划不堪重负
随着生成式AI的普及,黑客和研究人员开始利用AI工具大量生成低质量的漏洞报告,导致企业漏洞赏金计划面临‘永无止境’的垃圾信息洪流。这些AI生成的报告常常缺乏实质内容,却消耗了大量人力资源进行审核。据Ars Technica援引《金融时报》记者Jamie John的报道,多家知名科技公司的漏洞赏金计划管理者表示,AI伪造的漏洞报告数量激增,严重影响了真实漏洞的发现效率。
亚马逊推出Alexa for Shopping,Rufus购物助手融入后台
亚马逊正式发布Alexa for Shopping,将旗下Rufus购物聊天机器人与Alexa+整合至应用、网站及Echo Show设备中。该助手可回答产品问题、比较商品、追踪价格并支持购物提醒,还能处理定时购物及符合条件的自动购买。这一整合标志着亚马逊正将智能语音购物推向新阶段,让对话式AI成为电商核心交互方式。