测评 AAAI 2025:LMSYS Org 发布Chatbot Arena最新基准 LMSYS Org 在 AAAI 2025 大会上发布了 Chatbot Arena 的最新基准测试结果。该基准采用 Elo Rating 系统,通过海量用户投票评估了众多大语言模型的表现。Claude 3.5 Sonnet 以 1300+ MLC AAAI 2025 Chatbot Arena Elo Rating 2026年2月10日 3,510