印度AI实验室Sarvam新模型:开源AI可行性的重大押注
印度AI初创公司Sarvam推出全新模型阵容,包括30亿和105亿参数大语言模型、文本转语音模型、语音转文本模型,以及用于文档解析的视觉模型。这一发布标志着Sarvam对开源AI未来的坚定信心,在全球AI竞争中突出印度本土创新力量。这些模型
印度AI初创公司Sarvam推出全新模型阵容,包括30亿和105亿参数大语言模型、文本转语音模型、语音转文本模型,以及用于文档解析的视觉模型。这一发布标志着Sarvam对开源AI未来的坚定信心,在全球AI竞争中突出印度本土创新力量。这些模型
阿里巴巴最新Qwen 3.5系列模型发布,在商用硬件上实现与前沿闭源模型相当的性能,挑战美国实验室主导的专有AI经济格局。开源模型正迅速缩小性能差距,为企业带来推理成本大幅降低和部署灵活性提升。这一趋势标志着AI民主化进程加速,推动行业从高
在讨论AI基础设施成本时,焦点通常落在NVIDIA和GPU上,但内存正迅速崛起为关键因素。随着大语言模型的规模膨胀,训练和推理过程中对高带宽内存的需求急剧增加,导致内存成为限制性能和成本的核心瓶颈。文章探讨了这一转变背后的技术原因,并分析内
Anthropic 近日推出 Sonnet 4.6,这是其中型 Sonnet 模型的最新版本,严格遵循公司四个月的更新周期。此次升级在保持高效计算成本的同时,进一步提升了模型的推理能力和多模态处理性能,标志着 Anthropic 在 AI
随着大语言模型进入安全、合规关键环境,对抗性提示鲁棒性已成为运营必需。单轮越狱攻击持续暴露系统弱点。MLCommons 推出基于分类法的评估方法,建立可辩护、可复现的基准基础。该方法采用机制优先的单轮提示攻击分类法,确保确定性标注、一一映射
NVIDIA 正式开源 PersonaPlex-7B,这是一款专为实时全双工语音交互设计的端到端 AI 模型。该模型打破了传统“对话-等待”的模式,支持随时打断、自然语气反馈及极低延迟响应(首字延迟仅 170ms)。它基于 Moshi 架构
加拿大AI初创公司Cohere在2025年年度经常性收入(ARR)突破2.4亿美元,彰显企业级AI需求的强劲势头。随着OpenAI和Anthropic等巨头的激烈竞争,这家初创企业正积极筹备潜在IPO。Cohere凭借其专注于企业定制化大语
Moonshot AI推出Kimi k1.5模型,支持200万字上下文长度,长文分析能力领先。该模型免费开放,中文优化出色,在X平台中英讨论火爆。国产AI借长上下文弯道超车,应用场景广阔,企业青睐有加。
Meta推出Llama 3.1 405B,开源领域最强大模型,MMLU得分88.6%,支持多语言,部署便捷。免费商用级性能挑战闭源垄断,发布后下载量飙升,X平台互动超15万,开发者热议部署体验。
AI代理充满风险。即使局限于聊天窗口,大语言模型(LLM)也会出错或行为不当。一旦赋予它们浏览器、邮箱等外部工具,错误后果将急剧放大。这或许解释了为何科技巨头在推进AI代理时如此谨慎。本文探讨AI安全挑战、现有风险案例及潜在解决方案,分析未
中国AI公司DeepSeek推出V2模型聊天机器人,免费开放使用,其中文能力媲美GPT-4o,在编程和数学领域表现出色。一天内X平台中文讨论超10万,转发量领跑,凭借高性价比迅速引爆中国AI圈,标志着国产大模型崛起。
MLCommons 最新发布 Llama 3.1 8B 模型训练基准报告,由 LMSYS Org 贡献。该报告详细记录了使用标准硬件集群训练该 8B 参数模型的全过程,包括数据准备、训练时长、能耗和性能指标。结果显示,在 4090 张 H1
阿里云通义千问团队推出Qwen2.5-Max大模型,参数规模达数百亿,在数学和编码基准测试中超越Google Gemini 1.5 Pro。该模型开源免费策略引发中文社区热议,转发超3万次,被视为国产AI崛起标志,性能领先与本土优化备受关注
MIT Technology Review解析:每次OpenAI、Google或Anthropic发布前沿大语言模型,AI社区都屏息以待,直到METR给出评估结果。这个图表被视为AI进展的风向标,却饱受误解。它并非显示scaling定律失效
微软研究员推出创新扫描方法,可在不知触发器或预期结果的情况下识别中毒AI模型。针对开放权重大语言模型的供应链漏洞,独特内存泄漏和注意力模式暴露'潜伏特工'威胁。这些后门模型在激活前保持休眠,潜在风险巨大。该技术为企业集成开源LLM提供安全保
Meta发布Llama 3.1系列最大模型405B参数版,支持128K长上下文和多语言能力,性能超越GPT-4o mini。开源后下载量暴增,X平台讨论超30万条。开发者赞其推动AI民主化,成为免费强大工具。
Anthropic 最新推出 Opus 4.6 模型版本,引入革命性‘代理团队’功能,旨在显著扩展其能力边界和市场吸引力。该更新允许多个 AI 代理协同协作,处理复杂多任务场景,支持企业级应用从自动化客服到科研模拟等多种用途。相比前代,Op
MIT Technology Review解析:每次OpenAI、Google或Anthropic发布前沿大语言模型,AI社区都屏息以待,直到METR公布结果。这个图表追踪模型性能随计算量变化,却常被误解为AI进步停滞的证据。本文揭开其真相
微软研究人员推出创新扫描方法,能识别中毒的开源大语言模型(LLM),无需知晓触发器或预期结果。组织在使用开源权重LLM时面临供应链漏洞,独特内存泄漏和内部注意力模式暴露了隐藏的‘休眠代理’威胁。这些后门模型在闲置时潜伏,一旦激活即可执行恶意
《MIT科技评论》的平日通讯《下载》带来科技前沿动态。本期聚焦AI领域最易误解的图表:每当OpenAI、Google或Anthropic发布前沿大语言模型,社区屏息以待METR的评估结果。该图表揭示模型性能与计算资源的关联,却常被误读。同时