大语言模型相关AI资讯

印度AI实验室Sarvam新模型：开源AI可行性的重大押注

印度AI初创公司Sarvam推出全新模型阵容，包括30亿和105亿参数大语言模型、文本转语音模型、语音转文本模型，以及用于文档解析的视觉模型。这一发布标志着Sarvam对开源AI未来的坚定信心，在全球AI竞争中突出印度本土创新力量。这些模型

Sarvam AI 开源模型印度AI 大语言模型

2026年2月18日 731

海外

阿里Qwen颠覆专有AI模型经济模式

阿里巴巴最新Qwen 3.5系列模型发布，在商用硬件上实现与前沿闭源模型相当的性能，挑战美国实验室主导的专有AI经济格局。开源模型正迅速缩小性能差距，为企业带来推理成本大幅降低和部署灵活性提升。这一趋势标志着AI民主化进程加速，推动行业从高

阿里巴巴Qwen 开源AI AI模型经济大语言模型

2026年2月18日 556

海外

运行AI模型：内存已成为新战场

在讨论AI基础设施成本时，焦点通常落在NVIDIA和GPU上，但内存正迅速崛起为关键因素。随着大语言模型的规模膨胀，训练和推理过程中对高带宽内存的需求急剧增加，导致内存成为限制性能和成本的核心瓶颈。文章探讨了这一转变背后的技术原因，并分析内

AI基础设施内存优化 NVIDIA GPU 大语言模型

2026年2月18日 477

海外

Anthropic 发布 Sonnet 4.6：中型模型四月迭代再升级

Anthropic 近日推出 Sonnet 4.6，这是其中型 Sonnet 模型的最新版本，严格遵循公司四个月的更新周期。此次升级在保持高效计算成本的同时，进一步提升了模型的推理能力和多模态处理性能，标志着 Anthropic 在 AI

Anthropic Sonnet 4.6 AI模型大语言模型

2026年2月18日 742

测评

MLCommons 为可辩护越狱基准测试奠基

随着大语言模型进入安全、合规关键环境，对抗性提示鲁棒性已成为运营必需。单轮越狱攻击持续暴露系统弱点。MLCommons 推出基于分类法的评估方法，建立可辩护、可复现的基准基础。该方法采用机制优先的单轮提示攻击分类法，确保确定性标注、一一映射

MLC MLCommons 越狱攻击基准测试

2026年2月18日 796

原创

NVIDIA 发布 PersonaPlex-7B：全双工语音 AI 登场，终结“对讲机式”对话时代

NVIDIA 正式开源 PersonaPlex-7B，这是一款专为实时全双工语音交互设计的端到端 AI 模型。该模型打破了传统“对话-等待”的模式，支持随时打断、自然语气反馈及极低延迟响应（首字延迟仅 170ms）。它基于 Moshi 架构

NVIDIA AI PersonaPlex-7B 开源模型

2026年2月17日 948

海外

Cohere年营收超2.4亿美元为IPO铺平道路

加拿大AI初创公司Cohere在2025年年度经常性收入（ARR）突破2.4亿美元，彰显企业级AI需求的强劲势头。随着OpenAI和Anthropic等巨头的激烈竞争，这家初创企业正积极筹备潜在IPO。Cohere凭借其专注于企业定制化大语

Cohere IPO 企业AI 营收增长

2026年2月13日 695

原创

Moonshot AI发布Kimi k1.5：200万字超长上下文，国产大模型再破纪录

Moonshot AI推出Kimi k1.5模型，支持200万字上下文长度，长文分析能力领先。该模型免费开放，中文优化出色，在X平台中英讨论火爆。国产AI借长上下文弯道超车，应用场景广阔，企业青睐有加。

Kimi k1.5 Moonshot AI 200万上下文中文AI

2026年2月13日 1,772

原创

Meta发布Llama 3.1 405B：开源最强模型MMLU达88.6%，开发者社区狂欢

Meta推出Llama 3.1 405B，开源领域最强大模型，MMLU得分88.6%，支持多语言，部署便捷。免费商用级性能挑战闭源垄断，发布后下载量飙升，X平台互动超15万，开发者热议部署体验。

Llama 3.1 Meta 开源AI 大语言模型

2026年2月12日 770

海外

安全的AI助手可能实现吗？

AI代理充满风险。即使局限于聊天窗口，大语言模型（LLM）也会出错或行为不当。一旦赋予它们浏览器、邮箱等外部工具，错误后果将急剧放大。这或许解释了为何科技巨头在推进AI代理时如此谨慎。本文探讨AI安全挑战、现有风险案例及潜在解决方案，分析未

AI代理 AI安全大语言模型工具集成

2026年2月12日 456

原创

DeepSeek-V2聊天机器人爆火：国产AI性能直追GPT-4o

中国AI公司DeepSeek推出V2模型聊天机器人，免费开放使用，其中文能力媲美GPT-4o，在编程和数学领域表现出色。一天内X平台中文讨论超10万，转发量领跑，凭借高性价比迅速引爆中国AI圈，标志着国产大模型崛起。

DeepSeek V2 国产AI 聊天机器人

2026年2月12日 496

测评

训练 Llama 3.1 8B：MLCommons 基准详解

MLCommons 最新发布 Llama 3.1 8B 模型训练基准报告，由 LMSYS Org 贡献。该报告详细记录了使用标准硬件集群训练该 8B 参数模型的全过程，包括数据准备、训练时长、能耗和性能指标。结果显示，在 4090 张 H1

MLC Llama 3.1 模型训练 MLCommons

2026年2月10日 741

原创

阿里云发布Qwen2.5-Max：数学编码基准超Gemini 1.5 Pro，开源策略点燃国产AI热议

阿里云通义千问团队推出Qwen2.5-Max大模型，参数规模达数百亿，在数学和编码基准测试中超越Google Gemini 1.5 Pro。该模型开源免费策略引发中文社区热议，转发超3万次，被视为国产AI崛起标志，性能领先与本土优化备受关注

Qwen2.5 阿里云开源模型大语言模型

2026年2月9日 532

海外

AI中最被误解的图表

MIT Technology Review解析：每次OpenAI、Google或Anthropic发布前沿大语言模型，AI社区都屏息以待，直到METR给出评估结果。这个图表被视为AI进展的风向标，却饱受误解。它并非显示scaling定律失效

AI图表 METR评估 Scaling定律大语言模型

2026年2月9日 400

海外

微软揭秘：无需触发器即可检测AI潜伏后门

微软研究员推出创新扫描方法，可在不知触发器或预期结果的情况下识别中毒AI模型。针对开放权重大语言模型的供应链漏洞，独特内存泄漏和注意力模式暴露'潜伏特工'威胁。这些后门模型在激活前保持休眠，潜在风险巨大。该技术为企业集成开源LLM提供安全保

微软AI 后门检测大语言模型 AI安全

2026年2月9日 446

原创

Meta开源Llama 3.1 405B：开源AI性能巅峰，开发者社区沸腾

Meta发布Llama 3.1系列最大模型405B参数版，支持128K长上下文和多语言能力，性能超越GPT-4o mini。开源后下载量暴增，X平台讨论超30万条。开发者赞其推动AI民主化，成为免费强大工具。

Llama 3.1 开源模型 Meta AI 大语言模型

2026年2月7日 454

海外

Anthropic 发布 Opus 4.6：新增“代理团队”功能大升级

Anthropic 最新推出 Opus 4.6 模型版本，引入革命性‘代理团队’功能，旨在显著扩展其能力边界和市场吸引力。该更新允许多个 AI 代理协同协作，处理复杂多任务场景，支持企业级应用从自动化客服到科研模拟等多种用途。相比前代，Op

Anthropic Opus 4.6 AI代理团队大语言模型

2026年2月6日 399

海外

AI领域最被误解的图表

MIT Technology Review解析：每次OpenAI、Google或Anthropic发布前沿大语言模型，AI社区都屏息以待，直到METR公布结果。这个图表追踪模型性能随计算量变化，却常被误解为AI进步停滞的证据。本文揭开其真相

AI图表 METR 缩放定律大语言模型

2026年2月5日 384

海外

微软揭秘：无需触发器即可检测AI休眠代理后门

微软研究人员推出创新扫描方法，能识别中毒的开源大语言模型（LLM），无需知晓触发器或预期结果。组织在使用开源权重LLM时面临供应链漏洞，独特内存泄漏和内部注意力模式暴露了隐藏的‘休眠代理’威胁。这些后门模型在闲置时潜伏，一旦激活即可执行恶意

微软AI 模型安全休眠代理后门检测

2026年2月5日 386

海外

《下载》：AI追踪难题与下一代核电革命

《MIT科技评论》的平日通讯《下载》带来科技前沿动态。本期聚焦AI领域最易误解的图表：每当OpenAI、Google或Anthropic发布前沿大语言模型，社区屏息以待METR的评估结果。该图表揭示模型性能与计算资源的关联，却常被误读。同时

AI评估大语言模型下一代核电 SMR

2026年2月5日 433

大语言模型 相关资讯