代码生成相关资讯

文心4.0一行代码暴露致命缺陷：当AI连字典都不认识

文心一言4.0在最新评测中出现戏剧性崩盘：原本满分的Python字典推导题目直接跌至0分，输出结果暴露出模型对基础数据结构的理解出现严重混乱，稳定性评分暴跌3.7分。

文心一言4.0 编程能力代码生成模型退化

2026年3月21日 638

Claude 3.5 Sonnet代码能力升级：超越GPT-4o，加速编程革命

Anthropic近日更新Claude 3.5 Sonnet模型，其代码生成能力在多项基准测试中领先GPT-4o，高效处理复杂编程任务。程序员实战案例在X平台转发超20万次，引发热议：AI是否将重塑软件开发流程？本文深度剖析技术细节与行业影

Claude 3.5 代码生成 Anthropic AI编程

2026年2月7日 798

Claude 3.5 Sonnet领跑SWE-bench基准，代码生成能力超越GPT-4o

Anthropic最新发布的Claude 3.5 Sonnet模型在SWE-bench软件工程基准测试中表现出色，超越OpenAI的GPT-4o，得分领先显著。开发者社区分享实战案例，转发量超8万。该模型通过强化学习优化前端任务，进一步巩固

Claude 3.5 Sonnet 代码生成 Anthropic SWE-bench

2026年2月2日 639