OpenRouter Fusion API发布多模型融合成本减半引行业分歧

2026年6月15日 28 约2分钟 News Factory

AI API 模型融合 OpenRouter

2026年6月13日，OpenRouter发布Fusion API，允许多模型并行融合运行，宣称在多项任务中达到Fable级别智能且成本减半。

Fusion API的核心在于同时调用多个基础模型，对输出进行实时融合。该机制在推理阶段并行处理不同模型结果，再通过合成层输出最终答案。

开发者需指定参与融合的模型列表和权重分配。系统自动分配计算资源，输出端统一返回结果。融合层的具体算法细节尚未公开。

已发布测试显示，Fusion API在部分基准测试中达到Fable级别表现，成本降低一半。成本下降来自按实际使用量计费，而非固定调用多个模型的叠加费用。

与单一模型API相比，Fusion API提供并行融合能力，减少开发者手动切换模型的代码工作量。与早期模型路由工具相比，Fusion API在运行时完成融合，而非仅做请求分发。

与开源融合框架相比，Fusion API提供托管调用和统一计费，省去自建基础设施的维护成本。但灵活性低于开源方案，用户无法完全控制融合逻辑。

部分开发者反馈，在特定任务中融合结果出现逻辑不一致的情况。行业批评者指出，过度依赖多模型融合可能削弱单一模型的持续优化动力。

成本减半的前提是实际调用量和模型组合符合预期。若参与融合的模型数量增加，实际费用可能超出预期。

开发者可先在非核心功能模块测试Fusion API，记录每次调用的模型组合和输出质量。对于需要高一致性的应用，保留回退到单一模型的接口设计。

企业评估Fusion API时，应将成本模型与现有API调用量对比，计算实际节省幅度。建议与法务团队确认数据使用条款，特别是多模型并行时的输入输出归属。

在生产环境部署前，进行为期两周的A/B测试，验证融合结果是否满足业务指标。

OpenRouter Fusion API发布 多模型融合成本减半引行业分歧