大语言模型相关AI资讯

Probably获900万美元融资，打造零幻觉AI

AI初创公司Probably宣布完成900万美元融资，旨在解决大语言模型最棘手的幻觉与事实错误问题。其目标是将AI的准确率提升至与数据库、规则引擎等确定性系统相媲美的水平，从而让企业用户放心信任AI输出。本轮融资由知名风投领投，将用于技术研

AI可靠性融资幻觉确定性系统

5天前 144

海外

“疯狂”的Token消耗正在考验老板们的AI押注

随着企业争相部署大语言模型，AI推理的成本核心——Token消耗量正以惊人速度增长。硅谷一家软件公司和一家电商巨头向WIRED透露了他们如何通过“代币经济学”优化支出，在效率与创新之间寻找平衡。这不仅是财务挑战，更可能重塑AI行业的产品设计

AI成本代币经济学大语言模型企业科技

5天前 104

海外

Coinbase推出AI代理：让投资组合自动交易

Coinbase for Agents 将AI与金融执行通道直接相连，实现从用户投资组合自动执行交易与支付。该工具解决了大语言模型虽能分析海量市场数据、研究投资机会，却无法直接操作真实金融账户的核心痛点。通过自然语言指令，用户可让AI代理完

AI交易 Coinbase 自动化投资大语言模型

2026年6月13日 157

海外

OpenAI推出“锁定模式”防御提示注入，保护敏感数据

OpenAI于6月7日发布Lockdown Mode（锁定模式），旨在降低ChatGPT在遭遇提示注入攻击时泄露敏感数据的风险。该模式通过限制模型上下文窗口和禁用非必要功能，为企业和开发者提供额外安全层。然而专家指出，这并非绝对解决方案，底

OpenAI 提示注入安全大语言模型

2026年6月7日 479

海外

Airbnb CEO宣布成立AI实验室，谨慎布局大模型

Airbnb CEO Brian Chesky宣布计划成立一个新的AI实验室，聚焦大型语言模型等前沿技术。此前他曾表示不愿与现有LLM合作，认为产品不够成熟。这一举动标志着共享住宿巨头正式切入AI核心研发，旨在通过自研技术提升用户体验与运营

Airbnb 人工智能大语言模型共享住宿

2026年6月5日 362

海外

抵御俄式宣传：爱沙尼亚评出抗洗脑能力最强的大模型

爱沙尼亚政府发布了一项针对大语言模型（LLM）的基准测试，评估了数十款模型抵抗俄罗斯“战略叙事”虚假信息的能力。测试结果揭示了哪些模型更擅长识别并拒绝传播俄式宣传，为AI安全与地缘信息对抗提供了新视角。

AI安全虚假信息大语言模型地缘政治

2026年6月5日 281

海外

谷歌Gemma 4 12B：16GB内存笔记本即可运行

谷歌发布全新Gemma 4 12B模型，凭借创新的编码方案与令牌预测技术，在仅需16GB内存的笔记本电脑上即可流畅运行，性能却可媲美更大参数模型。这一突破将加速AI本地化部署，降低使用门槛。

谷歌 Gemma 4 轻量级AI 边缘计算

2026年6月4日 350

海外

Meta的AI追赶之路：能否缩小与对手的差距？

在人工智能竞赛中，Meta一直被视为追赶者，尽管其开源大模型LLaMA系列引发关注，但外界对其能否真正缩小与OpenAI和Google的差距仍存疑虑。本文深入分析Meta的AI战略：从大规模投资算力基础设施到押注开源生态，再到将AI融入社交

Meta 人工智能大语言模型开源

2026年6月3日 233

海外

沃尔玛AI工作流遭遇财务现实

沃尔玛曾鼓励员工无限制使用内部AI助手Code Puppy，但大语言模型的高昂成本迫使公司调整策略，开始限制使用额度。本文解析沃尔玛的AI实践如何从“全速推进”转向“精打细算”，并探讨企业级AI应用面临的成本与收益平衡难题。

AI成本沃尔玛大语言模型企业级AI

2026年6月3日 198

海外

谷歌AI连自家名字都拼错，这尴尬了谁？

谷歌旗下AI模型在生成文本时频繁出现拼写错误，甚至连公司名“Google”都无法正确拼写。本文深入剖析了这种现象背后的技术原因——基于token的分词机制与概率生成逻辑的固有缺陷，同时对比了OpenAI等竞争对手的处理方式，并指出这不仅是“

谷歌AI 大语言模型拼写错误 Tokenization

2026年5月28日 222

海外

赋予OpenClaw智能体物理形体

AI模型的编码能力正大幅降低机器人开发的门槛。通过将大语言模型与实体机器人结合，开发者可以用自然语言指令快速部署复杂动作。本文作者尝试为自己的OpenClaw智能体赋予物理身体，展示了AI从虚拟到现实的关键一步。这一趋势预示着机器人将不再是

AI机器人智能体机器人开发大语言模型

2026年5月21日 226

海外

阿里推出智能体专用芯片，重新定义AI竞赛

阿里巴巴近日发布专为AI智能体设计的处理器Zhenwu M890，并宣布了一系列芯片路线图和新大语言模型。此举表明阿里正构建集成式AI堆栈，而非仅填补美国出口管制空白。该芯片针对智能体工作负载优化，有望改变AI芯片竞争焦点，从通用算力转向智

阿里巴巴 AI芯片智能体大语言模型

2026年5月20日 312

海外

ArXiv新规：全用AI写论文将被封号一年

预印本平台ArXiv宣布将严厉打击在科学论文中不加节制使用大语言模型的行为。新政策规定，若被发现完全依赖AI生成内容、未进行实质性人工贡献的作者，将被禁止提交论文一年。此举旨在维护学术诚信，遏制AI在科研写作中的滥用。ArXiv作为全球最大

ArXiv AI写作学术诚信大语言模型

2026年5月17日 589

海外

你点头的那些AI术语，该弄懂了

随着AI技术迅猛发展，大量专业术语和网络俚语涌入日常对话。许多人面对“大模型”“AGI”“对齐”等词汇时只能点头附和，但内心充满疑问。本文系统梳理了当前最核心的AI概念，从Transformer到扩散模型，从强化学习到提示工程，并补充行业背

AI术语大语言模型技术科普机器学习

2026年5月10日 342

海外

海底跳跃器与军事聊天机器人：今日科技简报

本周科技简报聚焦两大前沿：一种可反复潜入深海6000米的廉价水下跳跃器，有望大幅降低深海科考成本，但也可能加速深海采矿。同时，美军正测试基于大语言模型的战术聊天机器人，旨在提升战场决策效率，但引发伦理担忧。两项技术均展示了AI与自动化对传统

深海科学海底采矿军事AI 大语言模型

2026年5月6日 262

海外

OpenAI发布GPT-5.5 Instant：ChatGPT新默认模型登场

OpenAI于2026年5月6日推出了GPT-5.5 Instant，作为ChatGPT的新默认模型。该模型在法律、医学、金融等敏感领域显著减少了AI幻觉现象，同时保持了前代模型的低延迟特性。这一更新旨在提升模型在专业场景下的可靠性与实用性

OpenAI GPT-5.5 聊天机器人 AI幻觉

2026年5月6日 5,420

海外

哈佛研究：AI急诊诊断准确率超越人类医生

哈佛大学最新研究发现，在真实急诊病例中，大型语言模型的诊断准确率高于两名人类医生。这一结果引发了对AI辅助医疗的广泛讨论，但也揭示了当前模型在临床推理和患者沟通上的短板。研究团队指出，AI应作为医生决策的补充工具，而非替代品。

AI医疗大语言模型哈佛研究急诊诊断

2026年5月4日 423

海外

基督徒专属手机网络：屏蔽色情与性别内容，LLM调试新思路

美国一家新手机网络瞄准基督徒用户，自动屏蔽色情与性别相关内容，引发言论自由争议。与此同时，大语言模型调试技术迎来突破，两者在内容过滤与模型校准上异曲同工。本文编译自MIT Technology Review，深度解析技术如何重塑信仰与AI的

基督教手机网络内容过滤大语言模型 AI调试

2026年5月1日 356

海外

初创公司新工具让LLM调试如探囊取物

旧金山初创公司Goodfire发布名为Silico的新工具，允许研究人员和工程师在训练期间深入AI模型内部，调整其参数——即决定模型行为的设置。这为模型制造商提供了前所未有的精细控制能力，改变了以往对AI技术构建方式的认知。Goodfire

大语言模型 AI可解释性机械可解释性模型调试

2026年5月1日 396

海外

OpenAI推出生物学专用大语言模型

OpenAI近日发布了一款专门针对生物学工作流程优化的大语言模型GPT-Rosalind。该模型在封闭访问模式下提供，旨在提升生物学领域的研究效率。通过对生物学数据和流程的深度学习，GPT-Rosalind可帮助科学家更高效地处理复杂的生物

OpenAI 生物学人工智能大语言模型

2026年4月17日 392

大语言模型 相关资讯