AI推理相关AI资讯 | 赢政天下 AI

MacPaw联手Liquid AI，为开发者提供本地推理能力

MacPaw宣布与Liquid AI达成合作，将在其应用商店生态中为开发者提供基于Liquid AI模型的设备端（on-device）推理能力。这意味着开发者无需依赖云端服务器，即可在Mac设备上运行高性能AI助手Eney的本地版本。此次合

MacPaw Liquid AI AI推理本地化

1天前 62

海外

法国AI新星ZML发布免费软件，大幅降低AI推理成本

法国AI初创公司ZML由图灵奖得主Yann LeCun背书，近日发布免费软件ZML/LLMD，旨在通过协调多款AI芯片加速推理过程，大幅降低运行成本。该软件可有效利用多种硬件资源，提升计算效率，为AI部署提供更经济高效的解决方案。据Tech

AI推理开源软件法国初创 Yann LeCun

2026年7月8日 471

海外

OpenAI携手博通推出首款定制芯片“Jalapeño”

据TechCrunch报道，OpenAI于2026年6月24日发布了其首款定制处理器“Jalapeño”，由博通（Broadcom）代工。该芯片专为AI推理系统设计，旨在优化性能与能效，减少对英伟达GPU的依赖。Jalapeño的推出标志着

OpenAI 定制芯片博通 AI推理

2026年6月25日 909

海外

AI推理创企Baseten再融15亿美元，估值飙至130亿

据TechCrunch报道，AI推理初创公司Baseten在上一轮巨额融资仅数月后，正接近完成新一轮15亿美元融资，估值达130亿美元。这轮融资正值“推理黄金热潮”持续升温，投资者争相押注能够高效运行AI模型的底层基础设施。Baseten专

AI推理 Baseten 融资估值

2026年6月19日 663

海外

英伟达200亿美元收购风波后，AI芯片新星Groq再获6.5亿美元融资

据Axios报道，AI芯片公司Groq正寻求通过内部融资筹集6.5亿美元，以从硬件制造转向专注于AI推理——这一过程旨在优化AI模型对提示请求的响应方式。此举发生在英伟达巨额收购传闻引发的行业震荡之后，标志着AI芯片竞争格局的进一步分化。本

AI芯片 Groq 融资 AI推理

2026年5月30日 385

海外

NVIDIA与谷歌合作降低AI推理成本

在Google Cloud Next大会上，谷歌与NVIDIA共同展示了其硬件路线图，旨在解决大规模AI推理的成本问题。两家公司详细介绍了新的A5X裸机实例，该实例运行在NVIDIA Vera Rubin NVL72机架级系统上。通过硬件和

AI推理 NVIDIA 谷歌成本降低

2026年4月23日 493

海外

Gimlet Labs优雅破解AI推理瓶颈，获8000万美元A轮融资

初创公司Gimlet Labs近日完成8000万美元A轮融资，其创新技术能让AI模型同时在NVIDIA、AMD、Intel、ARM、Cerebras和d-Matrix等多种芯片上运行，巧妙解决AI推理阶段的计算瓶颈。这一突破有望打破NVID

AI推理 Gimlet Labs 异构芯片融资新闻

2026年3月24日 493

海外

Reface与Prisma联合创始人联手Mirai，革新设备端AI模型推理

Reface和Prisma的联合创始人推出新创企Mirai，并完成1000万美元种子轮融资，专注于提升智能手机和笔记本等设备上AI模型的推理性能。这一创新旨在解决设备端AI运行的痛点，如功耗高、速度慢和隐私泄露风险。通过优化本地推理技术，M

AI推理设备端AI Mirai 种子轮融资

2026年2月20日 613

海外

AI推理独角兽Modal Labs洽谈25亿美元估值融资

据消息人士透露，四年历史的AI推理初创公司Modal Labs正与General Catalyst洽谈新一轮融资，估值高达25亿美元。该轮融资由General Catalyst领投，此举反映了AI基础设施领域投资热潮。随着生成式AI模型推理

AI推理 Modal Labs 融资独角兽

2026年2月12日 1,069

测评

Ares基准正式发布

MLCommons与LMSYS Org联合宣布Ares开源基准的推出，这是首个针对长上下文多代理推理的标准化评估框架。Ares整合Chatbot Arena的Elo Rating系统，测试模型在复杂任务中的表现，包括工具调用和多轮交互。首批

MLC Ares基准 LMSYS MLCommons

2026年2月10日 1,040

测评

MLPerf Client 1.5 正式发布

MLCommons 近日发布了 MLPerf Client 1.5 基准测试套件，这是客户端 AI 推理性能评估的最新版本。该版本引入了多项优化和新场景，包括更真实的客户端负载模拟，支持热门模型如 BERT 和 Stable Diffusi

MLC MLPerf 客户端基准 AI推理

2026年2月10日 786

海外

AI数学新星破解四大长期未解难题

一家名为Axiom的AI数学初创公司宣布，其AI系统成功解决了四个长期困扰数学家的未解难题。这一突破标志着AI推理能力的稳步提升，从简单证明到复杂问题求解，AI正逐步挑战人类数学巅峰。Axiom的成就不仅验证了大型语言模型在数学领域的潜力，

人工智能数学难题 Axiom初创 AI推理

2026年2月5日 650

AI推理 相关资讯