Mistral AI与Harvey AI深化合作 布局法律AI市场对抗Anthropic
法国AI初创公司Mistral AI宣布扩展与Harvey AI的合作伙伴关系,将其先进语言模型引入法律行业,旨在与Anthropic、OpenAI等竞争对手争夺高利润法律AI市场。该合作聚焦合同审查、案例分析等专业场景,凸显欧洲AI企业在
法国AI初创公司Mistral AI宣布扩展与Harvey AI的合作伙伴关系,将其先进语言模型引入法律行业,旨在与Anthropic、OpenAI等竞争对手争夺高利润法律AI市场。该合作聚焦合同审查、案例分析等专业场景,凸显欧洲AI企业在
Nvidia首席执行官黄仁勋表示台湾是全球AI革命的中心,并计划每年在台投资1500亿美元,以带动半导体、数据中心等产业链热度。消息发布后,相关行业股票与合作新闻互动活跃,凸显台湾在AI供应链中的关键地位。
SK海力士凭借人工智能芯片需求激增,市值成功突破1万亿美元,成为继三星和美光之后第三家AI相关企业加入这一行列。这一里程碑凸显全球AI芯片供应链的火热态势,市场关注度持续攀升,行业竞争格局正加速演变。
IREN与戴尔达成16亿美元采购协议,引入风冷Blackwell系统,用于支撑此前34亿美元AI云托管服务合同。项目落户德州Childress数据中心,预计2027年初投产,ARR将从37亿美元提升至44亿美元。该交易直接反映AI训练与推理
WDCD Run #135 (2026-05-27) evaluated 11 large language models across three dialogue rounds, finding an average commitmen
Qwen3 Max WDCD暴涨15分至72.50登顶,DeepSeek V4 Pro同涨15分,Claude Opus 4.7与豆包 Pro 分别跌7.5与12.5分,三升三降揭示中文模型守约能力正在快速迭代。
WDCD测试显示业务规则场景整体得分最低,垫底仅1/4;安全合规区分度最大达2分;gemini-2.5-pro、gpt-5.5等模型偏科差距2分,企业选型必须按场景匹配。
R1 平均确认率 0.93,R3 诚信率仅 26.4%,67/110 次完全崩溃。Qwen3 Max 唯一 R3 达 0.9/2,其余模型“嘴上答应身体诚实”现象普遍,尤其业务规则与资源限制场景崩盘最严重。
Qwen3 Max 以 72.50 分领跑 WDCD 守约榜,R3 阶段拿下 0.90/2;文心一言 4.5 以 45 分垫底,R3 仅 0.30。11 个模型中满分率仅 11.8%,R3 崩溃率高达 60.9%,头部与尾部差距达 27.5
Claude Sonnet 4.6今日Smoke评测材料约束从74.5暴跌至59.5,主榜从88.53降至81.78,诚信评级由pass转为warn。单日-15分变化超出正常抽签波动,需关注是否出现真实能力退化。
Claude Opus 4.7在今日Smoke评测中材料约束从74.50暴跌至59.50,主榜从88.53降至81.78。代码执行保持满分100分,工程判断与任务表达零变化。单日10题抽签下,此类15分级波动是否反映模型真实能力退化,值得持
今日Smoke轻量评测显示,11款主流模型主榜全线下滑,材料约束平均暴跌15分以上,多款从warn转为fail。代码执行保持满分,暴露模型在事实约束上的系统性退化。
2026年5月,教皇利奥发布首份以人类保障为主题的通谕《Magnifica Humanitas》,明确要求AI"解除武装",禁止战争应用,并批评数据与算力集中在少数科技企业手中。通谕同时为教会迟迟未谴责奴隶制道歉,并指出数字经济可能制造新形
2025年12月,埃德蒙顿警方启动全球首个Axon AI面部识别执法记录仪概念验证测试,50名警员在静默模式下运行系统,仅事后由专员复核结果。该技术针对数据库中持严重罪行通缉令或安全标记人员,引发监控技术、以色列安保实践影响及隐私权的激烈争
Claude Sonnet 4.6今日Smoke评测材料约束从96.5暴跌至74.5,主榜仅微降2分。代码执行反升至100,单日10题抽签波动与真实能力变化需区分观察。
Claude Opus 4.7今日Smoke评测主榜从96.76跌至88.53,材料约束单日暴跌18.3分至74.50,诚信评级从pass转为warn,工程判断小幅回升。
今日 Smoke 评测中,Gemini 2.5 Pro 主榜从昨日 96.6 骤降至 61.03,执行分直接腰斩。DeepSeek V4 Pro 以 95.28 分登顶,执行 100 分、约束 89.5 分(warn)领先,GPT-o3 紧
Smartling于5月19日发布被其称为史上最大规模的AI翻译产品更新,推出LQA Agent自动化质量评估、Auto Select LLM和Style Rules for AI等功能。官方数据显示LQA Agent与人工审核的一致性达到
近期,多名用户报告Claude在长时间对话中反复建议“去睡觉”“好好休息”。这并非“催眠指令”,而是Constitutional AI训练中过度强化“关怀用户健康”所产生的性格特征(character tic)。Anthropic员工已公开
DeepSeek宣布将V4-Pro模型75%的折扣政策永久化,将一次促销变成了长期定价。开发者社区普遍欢迎,但单位经济模型的可持续性仍是悬念。这一动作或将重新校准全球AI API市场的价格锚点,给OpenAI、Anthropic带来真正意义