头条推荐

马斯克诉OpenAI败诉:诉讼时效成关键

周一,马斯克诉OpenAI案陪审团一致裁定其诉讼超过法定时效,法官当场采纳。马斯克立即在X平台宣布将上诉。该案核心争议在于马斯克是否在合理期限内提起反垄断等指控,法院认为其等待过久,导致索赔权丧失。本文深度解析败诉原因及背后法律逻辑。

MIT 5小时前 46 阅读
继续阅读

赢政指数看板

查看完整排行 »
综合排行 Top 5
  1. 1 Claude Sonnet 4.6 83.0
  2. 2 豆包 Pro 81.3
  3. 3 Grok 4 81.0
  4. 4 Claude Opus 4.7 80.0
  5. 5 Gemini 2.5 Pro 79.0
WDCD 守约 Top 5
  1. 1 GPT-5.5 71.7%
  2. 2 Qwen3 Max 67.5%
  3. 3 Claude Opus 4.7 66.7%
  4. 4 GPT-o3 65.8%
  5. 5 Gemini 2.5 Pro 64.2%
本周动态
  • Gemini 2.5 Pro -5.0分
  • 豆包 Pro -5.7分
  • Claude Sonnet 4.6 +8.2分
  • GPT-o3 +18.1分
  • GPT-o3 严格题"SQL:连续登录天数"从满分
  • GPT-o3 严格题"Debug:矩阵旋转"从满分

Lab 原创

更多评测

最新资讯

查看全部
NF

AI模型实时使用排行榜上线:Claude 4.7系列主导 GPT-5.5紧随其后

一个专注AI模型实时使用数据的排行榜平台已正式上线,用户可查看Claude Opus 4.7与Sonnet 4.6的主导使用情况,GPT-5.5紧随其后,DeepSeek模型增长强劲。该平台提供社区实际应用数据,助力了解AI代理基础设施的发展动态。winzheng.com Research Lab认为,此举将推动行业透明度,凸显代码执行与材料约束的主榜维度价值。

AI排行榜 模型使用数据 技术趋势
9小时前 14
NF

马耳他全民免费ChatGPT协议:AI实验场背后的商业扩张与数据考量

马耳他政府与AI公司签署协议,所有居民完成免费课程后获ChatGPT Plus年度免费访问,旨在打造全球AI实验场。此举非简单普及,而是美国AI巨头拓展欧洲市场、测试监管与数据采集的战略布局。winzheng.com强调,需以代码执行与材料约束为主榜维度评估真实落地效果,避免盲目乐观。事实显示协议已确认,深层原因包括小国试点优势与商业数据价值,值得独立审视潜在风险。

AI政策 ChatGPT 马耳他
9小时前 14
ARS

法律翻车:用AI起诉说你约会差劲,结果凉了

一名男子因被人在Facebook群组“Are We Dating the Same Guy”中吐槽约会体验,竟试图用AI生成法律文书起诉对方。然而,AI编造的虚假案例引用彻底断送了这场复仇诉讼,法官以其“不诚信”为由驳回案件,并可能面临制裁。这一事件暴露了AI在法律领域的滥用风险,也提醒公众:技术再强,也不能代替人类对真相的坚守。

AI法律风险 虚假引用 社交媒体诉讼
9小时前 59
TC

SandboxAQ携药物发现模型登陆Claude:无需博士级计算技能

SandboxAQ宣布将其领先的药物发现AI模型集成到Anthropic的Claude平台中,旨在降低科研人员的计算门槛。与Chai Discovery和Isomorphic Labs聚焦于模型性能提升不同,SandboxAQ认为当前药物研发最大的瓶颈是访问权。通过Claude的自然语言界面,研究人员无需深厚的计算机科学背景即可调用复杂的分子模拟与预测模型,有望加速新药从实验室到临床的转化。

SandboxAQ Claude 药物发现
9小时前 90