台湾启动国家AI策略委员会:7月风险评估、2028产业法规,亚太治理竞赛悄然提速
台湾5月23日成立由行政院长主持的国家AI策略委员会,启动2025年12月通过的AI基本法执行工作。各机构须在7月前完成风险评估,2028年1月前制定产业AI法规。这是亚太地区"全政府"AI治理框架的最新动向,其执行力度与国际协同程度成为观
台湾5月23日成立由行政院长主持的国家AI策略委员会,启动2025年12月通过的AI基本法执行工作。各机构须在7月前完成风险评估,2028年1月前制定产业AI法规。这是亚太地区"全政府"AI治理框架的最新动向,其执行力度与国际协同程度成为观
本周共翻译 237 篇文章,覆盖 3 个AI模型。经抽样盲评,gpt-o3 综合得分最高(8.3/10)。报告详细对比各模型在准确性、流畅性、术语一致性方面的表现差异。
Modal Labs于5月21日宣布完成3.55亿美元C轮融资,估值46.5亿美元,由Redpoint Ventures和General Catalyst领投。过去一年其ARR从6000万美元跃升至3亿美元,实现5倍增长。公司serverl
Cohere正式开源Command A+,采用218B总参数、25B活跃参数的MoE架构,支持128K上下文与多模态输入。该模型在电信代理任务中得分从37%跃升至85%,终端基准硬难度从3%提升至25%。Apache 2.0许可允许企业自由
2026年5月24日,美国政府在签署前数小时撤回要求AI实验室前沿模型发布前接受90天联邦审查的计划,官方理由是避免削弱对中国的AI竞争优势。此举使OpenAI、Anthropic等实验室短期内免受联邦干预,但中期仍面临欧盟高风险评估与中国
文心一言4.5今日Smoke评测主榜暴跌27.2分,核心原因是代码执行维度从95直接腰斩至50,材料约束仅小降5.5分。单日10题抽签带来的波动是否掩盖了真实能力退化,值得持续追踪。
DeepSeek V4 Pro 在今日 Smoke 评测中诚信评级从 Fail 直接转为 Pass,主榜从 74.00 跃升至 97.08,材料约束单项上涨 23.5 分。单日 10 题快测下,这种幅度变化究竟是抽签运气还是真实能力回暖,需
今日Smoke评测显示,DeepSeek V4 Pro以97.08分(执行100、约束93.5)登顶,GPT-o3单日主榜暴涨31.4分,而文心一言4.5主榜暴跌27.2分、执行分直接腰斩至50,诚信评级从warn转为pass。
Anthropic最新Claude Mythos模型被曝可利用超万软件漏洞,引发网络安全界强烈关注。专家指出该模型潜在危险性高,不宜公开使用。事件迅速发酵,行业内外就AI模型安全性展开激烈辩论,Anthropic面临监管与信任双重压力。文章
OpenAI已正式向美国SEC提交S-1注册文件,标志着这家AI巨头从非营利组织向上市公司转型的重大一步。此举引发与Anthropic估值的对比讨论,凸显AI企业资本化进程的加速。文章分析其融资背景、行业影响及未来展望。
特朗普在Musk和Zuckerberg劝说下暂缓签署AI监管行政命令,担忧此举会削弱美国对华科技竞争力。David Sacks的干预成为焦点,行业内外对监管与创新平衡展开激烈讨论,政策走向仍存不确定性。
AI硬件初创公司Hark于2026年5月21日宣布完成7亿美元Series A融资,估值60亿美元,由Parkway Venture Capital领投,Nvidia、AMD Ventures等多方跟投。创始人Brett Adcock此前创
2026年5月22日,Andrew Ng在X平台发文批评白宫新绿卡政策,要求申请人从境外提交申请。他指出此举将伤害家庭、减少医生、教师和科学家数量,并损害美国在AI领域的竞争力。多位科技界人士随后跟进讨论。该政策可能加剧全球AI人才争夺,硅
GPT-o3今日Smoke评测主榜从76.05跌至58.08,代码执行从90.00直接腰斩至47.50,工程判断也从50跌到10。单日抽题波动虽属正常,但这一量级的断崖式下跌已超出随机范围,值得重点追踪。
文心一言4.5今日Smoke评测工程判断从50降至10、任务表达降20分,但材料约束暴涨24.7拉动主榜升至88.48,诚信从fail升至warn,单日抽签波动可能是主因。
GPT-5.5 本周 Smoke 成绩从60.58飙升至90.3,涨幅29.7分领跑;GPT-o3 则从94.51 断崖下跌至58.08,降幅36.4分最惨。Gemini 2.5 Pro 波动61.1分暴露一致性问题,DeepSeek V4
今日Smoke轻量评测显示,GPT-o3主榜暴跌18分至58.08,执行分直接腰斩;豆包Pro、Gemini 3.1 Pro分别暴涨35.8和34.7分,快速挤入前五。GPT-5.5以90.3继续领跑,文心一言诚信评级降至warn。
Qwen3.7-Max作为全新旗舰模型面向代理时代推出,支持端到端编码、多文件重构及35小时无干预内核优化任务,工具调用超1000次。API已上线供开发者测试。本文从winzheng.com Research Lab视角分析其技术原理、影响
NVIDIA与Dell于5月21日前后联合发布Dell AI Factory重大更新,该全栈平台支持企业级自主AI代理,从桌面工作站延伸至数据中心机架,采用NVIDIA Vera Rubin架构。文章基于已确认事实,分析其创新点与潜在不足,
密歇根Saline Township以4-1投票否决OpenAI与Oracle的160亿美元数据中心项目后,开发商提起诉讼,小镇因无力应诉陷入争议。事件凸显地方主权与AI基础设施扩张的张力,需从执行与材料约束维度审视技术部署的可持续性,而非