- 1 Claude Sonnet 4.6 83.0
- 2 豆包 Pro 81.3
- 3 Grok 4 81.0
- 4 Claude Opus 4.7 80.0
- 5 Gemini 2.5 Pro 79.0
马斯克诉OpenAI败诉:诉讼时效成关键
周一,马斯克诉OpenAI案陪审团一致裁定其诉讼超过法定时效,法官当场采纳。马斯克立即在X平台宣布将上诉。该案核心争议在于马斯克是否在合理期限内提起反垄断等指控,法院认为其等待过久,导致索赔权丧失。本文深度解析败诉原因及背后法律逻辑。
继续阅读赢政指数看板
查看完整排行 »- 1 GPT-5.5 71.7%
- 2 Qwen3 Max 67.5%
- 3 Claude Opus 4.7 66.7%
- 4 GPT-o3 65.8%
- 5 Gemini 2.5 Pro 64.2%
- ↓ Gemini 2.5 Pro -5.0分
- ↓ 豆包 Pro -5.7分
- ↑ Claude Sonnet 4.6 +8.2分
- ↑ GPT-o3 +18.1分
- ⚠ GPT-o3 严格题"SQL:连续登录天数"从满分
- ⚠ GPT-o3 严格题"Debug:矩阵旋转"从满分
Lab 原创
更多评测最新资讯
查看全部马斯克诉OpenAI败诉:诉讼时效成关键
周一,马斯克诉OpenAI案陪审团一致裁定其诉讼超过法定时效,法官当场采纳。马斯克立即在X平台宣布将上诉。该案核心争议在于马斯克是否在合理期限内提起反垄断等指控,法院认为其等待过久,导致索赔权丧失。本文深度解析败诉原因及背后法律逻辑。
AI的核心:算力、基建与安全——TechEx北美大会启示
TechEx北美大会揭示AI发展的关键不仅是算法突破,更在于电力、基础设施和安全等底层支撑。企业决策者需将目光从炫酷应用转向保障AI运行的能源、计算与防护体系。
AI模型实时使用排行榜上线:Claude 4.7系列主导 GPT-5.5紧随其后
一个专注AI模型实时使用数据的排行榜平台已正式上线,用户可查看Claude Opus 4.7与Sonnet 4.6的主导使用情况,GPT-5.5紧随其后,DeepSeek模型增长强劲。该平台提供社区实际应用数据,助力了解AI代理基础设施的发展动态。winzheng.com Research Lab认为,此举将推动行业透明度,凸显代码执行与材料约束的主榜维度价值。
Omni AI Companion推出Always Go Deeper功能 付费用户获NSFW视频支持
Omni AI Companion今日发布“Always Go Deeper”功能,提升对话流畅性与个性化深度。免费用户增强图像生成,付费用户开放高质量视频与NSFW模式,同时修复双图bug并新增Tarot功能。文章基于已确认事实分析创新与不足,对比同类产品,并提出开发者建议,突出winzheng.com技术价值观。
马耳他全民免费ChatGPT协议:AI实验场背后的商业扩张与数据考量
马耳他政府与AI公司签署协议,所有居民完成免费课程后获ChatGPT Plus年度免费访问,旨在打造全球AI实验场。此举非简单普及,而是美国AI巨头拓展欧洲市场、测试监管与数据采集的战略布局。winzheng.com强调,需以代码执行与材料约束为主榜维度评估真实落地效果,避免盲目乐观。事实显示协议已确认,深层原因包括小国试点优势与商业数据价值,值得独立审视潜在风险。
法律翻车:用AI起诉说你约会差劲,结果凉了
一名男子因被人在Facebook群组“Are We Dating the Same Guy”中吐槽约会体验,竟试图用AI生成法律文书起诉对方。然而,AI编造的虚假案例引用彻底断送了这场复仇诉讼,法官以其“不诚信”为由驳回案件,并可能面临制裁。这一事件暴露了AI在法律领域的滥用风险,也提醒公众:技术再强,也不能代替人类对真相的坚守。
SandboxAQ携药物发现模型登陆Claude:无需博士级计算技能
SandboxAQ宣布将其领先的药物发现AI模型集成到Anthropic的Claude平台中,旨在降低科研人员的计算门槛。与Chai Discovery和Isomorphic Labs聚焦于模型性能提升不同,SandboxAQ认为当前药物研发最大的瓶颈是访问权。通过Claude的自然语言界面,研究人员无需深厚的计算机科学背景即可调用复杂的分子模拟与预测模型,有望加速新药从实验室到临床的转化。
陪审团裁定:马斯克起诉OpenAI时机过晚
在一场备受瞩目的诉讼中,陪审团一致认为埃隆·马斯克起诉OpenAI过于拖延,法官随即确认了该裁决。马斯克指控OpenAI背离非营利初衷,但法律上已超诉讼时效。此案引发对AI治理和创始人责任的广泛讨论,马斯克已表示将提起上诉。
Anthropic收购OpenAI同款开发者工具公司Stainless
AI安全公司Anthropic宣布收购纽约初创公司Stainless,后者曾为OpenAI、Google和Cloudflare等科技巨头提供API管理工具。作为交易的一部分,Stainless将逐步关闭其所有托管产品。此次收购将帮助Anthropic强化开发者工具链,加速安全AI应用的部署。业界分析认为,此举反映了AI基础设施领域整合加速的趋势。
Grok 4 97.44 分登顶,GPT-o3 主榜暴跌 28 分
今日 Smoke 轻量评测显示 Grok 4 以 97.44 分领跑,Gemini 3.1 Pro 紧随其后。GPT-o3 主榜暴跌 28.1 分,代码执行从 100 直接腰斩至 50,Claude 两款模型同步崩盘,暴露执行能力严重退化。
揭秘Anduril与Meta联手打造军用AR眼镜:眼球追踪指挥无人机
防务科技公司Anduril与Meta合作,正为美军原型开发一款增强现实(AR)头显。该设备可通过眼球追踪和语音命令直接指挥无人机攻击。项目负责人、前陆军特种作战司令部军官Quay Barnett透露了更多细节,标志着军用智能眼镜迈向实战化。本文编译自MIT Technology Review。
重要信号:MIT内幕小组探讨AI关键趋势
在MIT技术评论举办的专家小组讨论中,多位业内领袖围绕AI领域最值得关注的信号展开深度对话。从技术突破到伦理边界,从资本流向到监管演变,他们剖析了那些预示未来格局变化的微弱但关键的趋势。本文编译自小组讨论的核心观点,并结合行业背景提供编者分析。