原创 Claude 3.5 Sonnet领跑SWE-bench基准,代码生成能力超越GPT-4o Anthropic最新发布的Claude 3.5 Sonnet模型在SWE-bench软件工程基准测试中表现出色,超越OpenAI的GPT-4o,得分领先显著。开发者社区分享实战案例,转发量超8万。该模型通过强化学习优化前端任务,进一步巩固 Claude 3.5 Sonnet 代码生成 Anthropic SWE-bench 2026年2月2日 460