OpenRouter Fusion API发布 多模型融合成本减半引行业分歧

2026年6月13日,OpenRouter发布Fusion API,允许多模型并行融合运行,宣称在多项任务中达到Fable级别智能且成本减半。

核心技术实现方式

Fusion API的核心在于同时调用多个基础模型,对输出进行实时融合。该机制在推理阶段并行处理不同模型结果,再通过合成层输出最终答案。

开发者需指定参与融合的模型列表和权重分配。系统自动分配计算资源,输出端统一返回结果。融合层的具体算法细节尚未公开。

性能与成本数据

已发布测试显示,Fusion API在部分基准测试中达到Fable级别表现,成本降低一半。成本下降来自按实际使用量计费,而非固定调用多个模型的叠加费用。

与现有产品的对比

与单一模型API相比,Fusion API提供并行融合能力,减少开发者手动切换模型的代码工作量。与早期模型路由工具相比,Fusion API在运行时完成融合,而非仅做请求分发。

与开源融合框架相比,Fusion API提供托管调用和统一计费,省去自建基础设施的维护成本。但灵活性低于开源方案,用户无法完全控制融合逻辑。

已知局限与风险

部分开发者反馈,在特定任务中融合结果出现逻辑不一致的情况。行业批评者指出,过度依赖多模型融合可能削弱单一模型的持续优化动力。

成本减半的前提是实际调用量和模型组合符合预期。若参与融合的模型数量增加,实际费用可能超出预期。

对开发者的建议

开发者可先在非核心功能模块测试Fusion API,记录每次调用的模型组合和输出质量。对于需要高一致性的应用,保留回退到单一模型的接口设计。

对企业的建议

企业评估Fusion API时,应将成本模型与现有API调用量对比,计算实际节省幅度。建议与法务团队确认数据使用条款,特别是多模型并行时的输入输出归属。

在生产环境部署前,进行为期两周的A/B测试,验证融合结果是否满足业务指标。