- 1 Claude Sonnet 4.6 83.0
- 2 豆包 Pro 81.3
- 3 Grok 4 81.0
- 4 Claude Opus 4.7 80.0
- 5 Gemini 2.5 Pro 79.0
特朗普推迟签署AI安全行政令:“我不想阻碍其领先”
美国总统特朗普推迟签署一项要求AI模型在发布前接受政府安全审查的行政命令,称对措辞不满,不愿在AI技术快速发展时设置障碍。此举引发科技界对AI安全与创新平衡的激烈讨论,业界担忧监管真空可能带来风险,而另一些人则担心过度审查会削弱美国AI竞争力。
继续阅读赢政指数看板
查看完整排行 »- 1 Claude Opus 4.7 65.0%
- 2 Claude Sonnet 4.6 62.5%
- 3 豆包 Pro 60.0%
- 4 Gemini 2.5 Pro 57.5%
- 5 Qwen3 Max 57.5%
- ↓ Qwen3 Max -10.0分
- ↓ GPT-o3 -10.8分
- ↓ GPT-5.5 -19.2分
- ↓ Gemini 3.1 Pro -8.3分
- ⚠ GPT-o3 严格题"SQL:连续登录天数"从满分
- ⚠ GPT-o3 严格题"Debug:矩阵旋转"从满分
Lab 原创
更多评测最新资讯
查看全部特朗普推迟签署AI安全行政令:“我不想阻碍其领先”
美国总统特朗普推迟签署一项要求AI模型在发布前接受政府安全审查的行政命令,称对措辞不满,不愿在AI技术快速发展时设置障碍。此举引发科技界对AI安全与创新平衡的激烈讨论,业界担忧监管真空可能带来风险,而另一些人则担心过度审查会削弱美国AI竞争力。
Tony Robbins联手Calm前高管打造更安全AI心理治疗
由励志大师Tony Robbins和Calm前高管共同创立的AI心理健康公司The Path,近日宣布其AI模型在行业权威安全基准Vera-MH上取得95分的高分,远超普通消费级聊天机器人的65分最高得分。这一成绩意味着The Path在AI心理治疗安全性上实现了显著突破,为未来普及AI辅助心理疗愈提供了更可靠的保障。公司强调,其模型经过专业临床医生深度训练,能更精准识别危机信号,避免有害建议,有望重塑AI心理健康服务的安全标准。
神秘AI新秀Hark获7亿美元A轮融资,估值达60亿
由Brett Adcock创立的AI初创公司Hark,在高度保密状态下完成7亿美元A轮融资,投资者给予60亿美元估值。这家公司自称打造“通用”AI界面,旨在重新定义人机交互方式。尽管产品细节尚未公开,但如此巨额融资和超高估值已经引发行业震动。本文将解析Hark的战略定位、创始人背景以及这笔交易背后的AI投资逻辑。
Anthropic的Code with Claude:编程的未来已来,你准备好了吗?
Anthropic在伦敦举办为期两天的开发者活动Code with Claude,展示了AI辅助编程的最新进展。活动与Google I/O同期举行,但并非巧合。Claude作为编程助手,正改变开发者工作流,提升效率的同时也引发关于人类角色、代码质量等深层思考。本文编译自MIT Technology Review,深入解析这场活动的意义与编程的未来。
Spotify播客新增AI问答与简报生成功能
Spotify宣布为播客平台引入AI驱动的问答与简报生成功能。用户可通过自然语言提示生成每日或每周的播客摘要,并在收听过程中向AI提问,获取内容解析。此举旨在提升播客发现效率与用户粘性,进一步巩固Spotify在音频领域的AI布局。行业分析认为,该功能可能重塑播客消费模式,但内容准确性仍是挑战。
Spotify推新应用,正面硬刚谷歌NotebookLM
Spotify今日发布全新桌面应用,以研究预览形式在超过20个市场上线。该应用直接对标谷歌NotebookLM,主打AI驱动的智能笔记与知识管理功能,但深度整合了Spotify的音频生态——用户可一键将播客、音乐中的关键信息转化为结构化笔记,并支持多模态检索与语音交互。这一举措标志着Spotify从流媒体平台向生产力工具的跨界延伸,也折射出音乐与信息消费的融合趋势。
Spotify推出ElevenLabs赋能有声书创作工具
Spotify宣布将于今年晚些时候推出基于ElevenLabs技术的有声书创作工具,允许作者和出版商通过AI语音合成快速生成有声书。此举标志着Spotify在音频内容领域的进一步扩张,并可能颠覆传统有声书制作模式。本文深度解析该工具的技术原理、市场影响及潜在挑战。
我用Gemini化身克隆了自己:结果像得吓人
作者利用Gemini应用创建了自己的数字克隆,生成逼真视频。谷歌视其为未来创作方向,但作者体验后感到毛骨悚然。本文深入探讨AI化身技术的现状、行业背景及伦理隐忧,揭示技术便利背后潜藏的风险。
在线安全未来之争:研究人员起诉特朗普政府,气候技术大转向
本期的《The Download》关注两大焦点:科技研究人员起诉特朗普政府,因政府持续打压研究仇恨言论的学者,试图影响在线安全的未来;同时,气候技术领域正经历重大转向,从昂贵的创新实验转向务实部署,政策和资本流向发生根本变化。
铝价飙升20%,回收初创公司押注AI掘金
随着全球铝价上涨20%,一批专注于回收的初创公司正积极利用人工智能技术提升铝等关键矿物的回收效率。这些企业希望通过AI驱动的分拣、预测和流程优化,从废弃物中提取更多高纯度铝材,从而构建一个大规模、可持续的金属供应源,同时应对资源短缺和环境压力。
谷歌向消费者力推AI代理生态,但用户会买账吗?
谷歌正在大力推广其AI代理生态系统,计划将各类智能助手融入用户日常生活。然而,面对隐私担忧、实用性质疑以及来自OpenAI等对手的竞争,消费者是否愿意接纳这些“数字管家”仍是未知数。本文深入分析谷歌的策略与市场挑战。
气候科技公司转型:从脱碳到关键矿物求生
在美国进入特朗普第二任期一年多后,气候行动的支持力度持续走弱。面对政策寒流,气候科技公司正积极寻找新的生存与增长路径,其中关键矿物领域成为重要突破口。从早期专注于碳减排,到如今在锂、稀土等矿物供应链中寻找机会,这一战略转移不仅帮助企业在不利环境中存活,更可能重新定义气候科技的未来发展方向。