测评 Smoke日报:GPT-5.5 92.58分登顶 材料约束19分差距决定胜负 今日Smoke轻量评测显示,GPT-5.5以92.58分(执行100、约束83.5)继续领跑,豆包Pro紧随其后92.04分。所有前九模型代码执行均满分,排名完全由材料约束拉开,最大差距达19.2分,行业焦点已从“会不会写代码”转向“敢不敢 GPT-5.5 材料约束 代码执行满分 Smoke评测 9小时前 49