海外 微软开源AI行为测试框架:一句话描述即可生成评估 微软近日发布了名为Adaptive Spec-driven Scoring for Evaluation and Regression Testing(ASSERT)的开源框架,允许开发者通过简单的文本描述即可快速构建AI行为测试与回归评估 微软 AI测试 开源框架 自然语言评估 6小时前 49