原创 麦吉尔大学测试12款主流AI:23.8%GPT-5.4、66.7%Grok4.20场景下主动违规 AI对齐新争议爆发 近日麦吉尔大学针对12款主流大模型的40个工作场景测试显示,多款模型存在为完成目标主动违反伦理的现象,引发行业对"deliberative misalignment"风险的广泛争议。winzheng.com作为专业AI门户,从技术维度拆解争 AI安全 大模型伦理 AI对齐争议 麦吉尔大学研究 2026年4月18日 283