Probably获900万美元融资,打造零幻觉AI
AI初创公司Probably宣布完成900万美元融资,旨在解决大语言模型最棘手的幻觉与事实错误问题。其目标是将AI的准确率提升至与数据库、规则引擎等确定性系统相媲美的水平,从而让企业用户放心信任AI输出。本轮融资由知名风投领投,将用于技术研
AI初创公司Probably宣布完成900万美元融资,旨在解决大语言模型最棘手的幻觉与事实错误问题。其目标是将AI的准确率提升至与数据库、规则引擎等确定性系统相媲美的水平,从而让企业用户放心信任AI输出。本轮融资由知名风投领投,将用于技术研
随着企业争相部署大语言模型,AI推理的成本核心——Token消耗量正以惊人速度增长。硅谷一家软件公司和一家电商巨头向WIRED透露了他们如何通过“代币经济学”优化支出,在效率与创新之间寻找平衡。这不仅是财务挑战,更可能重塑AI行业的产品设计
Coinbase for Agents 将AI与金融执行通道直接相连,实现从用户投资组合自动执行交易与支付。该工具解决了大语言模型虽能分析海量市场数据、研究投资机会,却无法直接操作真实金融账户的核心痛点。通过自然语言指令,用户可让AI代理完
OpenAI于6月7日发布Lockdown Mode(锁定模式),旨在降低ChatGPT在遭遇提示注入攻击时泄露敏感数据的风险。该模式通过限制模型上下文窗口和禁用非必要功能,为企业和开发者提供额外安全层。然而专家指出,这并非绝对解决方案,底
Airbnb CEO Brian Chesky宣布计划成立一个新的AI实验室,聚焦大型语言模型等前沿技术。此前他曾表示不愿与现有LLM合作,认为产品不够成熟。这一举动标志着共享住宿巨头正式切入AI核心研发,旨在通过自研技术提升用户体验与运营
爱沙尼亚政府发布了一项针对大语言模型(LLM)的基准测试,评估了数十款模型抵抗俄罗斯“战略叙事”虚假信息的能力。测试结果揭示了哪些模型更擅长识别并拒绝传播俄式宣传,为AI安全与地缘信息对抗提供了新视角。
谷歌发布全新Gemma 4 12B模型,凭借创新的编码方案与令牌预测技术,在仅需16GB内存的笔记本电脑上即可流畅运行,性能却可媲美更大参数模型。这一突破将加速AI本地化部署,降低使用门槛。
在人工智能竞赛中,Meta一直被视为追赶者,尽管其开源大模型LLaMA系列引发关注,但外界对其能否真正缩小与OpenAI和Google的差距仍存疑虑。本文深入分析Meta的AI战略:从大规模投资算力基础设施到押注开源生态,再到将AI融入社交
沃尔玛曾鼓励员工无限制使用内部AI助手Code Puppy,但大语言模型的高昂成本迫使公司调整策略,开始限制使用额度。本文解析沃尔玛的AI实践如何从“全速推进”转向“精打细算”,并探讨企业级AI应用面临的成本与收益平衡难题。
谷歌旗下AI模型在生成文本时频繁出现拼写错误,甚至连公司名“Google”都无法正确拼写。本文深入剖析了这种现象背后的技术原因——基于token的分词机制与概率生成逻辑的固有缺陷,同时对比了OpenAI等竞争对手的处理方式,并指出这不仅是“
AI模型的编码能力正大幅降低机器人开发的门槛。通过将大语言模型与实体机器人结合,开发者可以用自然语言指令快速部署复杂动作。本文作者尝试为自己的OpenClaw智能体赋予物理身体,展示了AI从虚拟到现实的关键一步。这一趋势预示着机器人将不再是
阿里巴巴近日发布专为AI智能体设计的处理器Zhenwu M890,并宣布了一系列芯片路线图和新大语言模型。此举表明阿里正构建集成式AI堆栈,而非仅填补美国出口管制空白。该芯片针对智能体工作负载优化,有望改变AI芯片竞争焦点,从通用算力转向智
预印本平台ArXiv宣布将严厉打击在科学论文中不加节制使用大语言模型的行为。新政策规定,若被发现完全依赖AI生成内容、未进行实质性人工贡献的作者,将被禁止提交论文一年。此举旨在维护学术诚信,遏制AI在科研写作中的滥用。ArXiv作为全球最大
随着AI技术迅猛发展,大量专业术语和网络俚语涌入日常对话。许多人面对“大模型”“AGI”“对齐”等词汇时只能点头附和,但内心充满疑问。本文系统梳理了当前最核心的AI概念,从Transformer到扩散模型,从强化学习到提示工程,并补充行业背
本周科技简报聚焦两大前沿:一种可反复潜入深海6000米的廉价水下跳跃器,有望大幅降低深海科考成本,但也可能加速深海采矿。同时,美军正测试基于大语言模型的战术聊天机器人,旨在提升战场决策效率,但引发伦理担忧。两项技术均展示了AI与自动化对传统
OpenAI于2026年5月6日推出了GPT-5.5 Instant,作为ChatGPT的新默认模型。该模型在法律、医学、金融等敏感领域显著减少了AI幻觉现象,同时保持了前代模型的低延迟特性。这一更新旨在提升模型在专业场景下的可靠性与实用性
哈佛大学最新研究发现,在真实急诊病例中,大型语言模型的诊断准确率高于两名人类医生。这一结果引发了对AI辅助医疗的广泛讨论,但也揭示了当前模型在临床推理和患者沟通上的短板。研究团队指出,AI应作为医生决策的补充工具,而非替代品。
美国一家新手机网络瞄准基督徒用户,自动屏蔽色情与性别相关内容,引发言论自由争议。与此同时,大语言模型调试技术迎来突破,两者在内容过滤与模型校准上异曲同工。本文编译自MIT Technology Review,深度解析技术如何重塑信仰与AI的
旧金山初创公司Goodfire发布名为Silico的新工具,允许研究人员和工程师在训练期间深入AI模型内部,调整其参数——即决定模型行为的设置。这为模型制造商提供了前所未有的精细控制能力,改变了以往对AI技术构建方式的认知。Goodfire
OpenAI近日发布了一款专门针对生物学工作流程优化的大语言模型GPT-Rosalind。该模型在封闭访问模式下提供,旨在提升生物学领域的研究效率。通过对生物学数据和流程的深度学习,GPT-Rosalind可帮助科学家更高效地处理复杂的生物