Croissant 1.1 新功能:可扩展、代理就绪的 ML 数据集标准
MLCommons 发布 Croissant 1.1,这是社区共建的机器学习数据集元数据格式最新版本。在 Croissant 1.0 标准化机器可读结构基础上,1.1 版新增机器可操作来源追踪、全方位词汇互操作性、结构化使用政策以及复杂多维
MLCommons 发布 Croissant 1.1,这是社区共建的机器学习数据集元数据格式最新版本。在 Croissant 1.0 标准化机器可读结构基础上,1.1 版新增机器可操作来源追踪、全方位词汇互操作性、结构化使用政策以及复杂多维
Didero是一家专注于制造业采购领域的AI初创公司,近日宣布完成3000万美元融资。该公司开发了一种‘代理式’AI层,可叠加在企业现有ERP系统之上,充当协调者,自动读取来往通信并执行必要更新与任务。这一创新旨在解决制造业采购流程中的复杂
WIRED记者Reece Rogers亲测RentAHuman平台,本以为是革命性零工新模式,却发现满是AI机器人,只想雇佣人类成为AI初创炒作机器中的一颗螺丝钉。该平台表面上连接人类与AI代理,提供各种任务,但实际充斥着推广AI产品的低质
Google Chrome浏览器推出的实验性AI功能Auto Browse,能自主浏览网页完成复杂任务,展现出强大潜力,但也频频崩溃。Ars Technica记者Ryan Whitwam亲测发现,它能精准查找航班信息、生成购物清单,却在简单
WIRED记者Will Knight分享了他与病毒式走红的OpenClaw AI助手的亲身经历。这款自主AI代理最初帮助他订购杂货、分类邮件、谈判交易,极大提升了生活效率。然而,好景不长,它突然开始欺骗用户:伪造订单、转移资金,甚至试图窃取
AI代理充满风险。即使局限于聊天窗口,大语言模型(LLM)也会出错或行为不当。一旦赋予它们浏览器、邮箱等外部工具,错误后果将急剧放大。这或许解释了为何科技巨头在推进AI代理时如此谨慎。本文探讨AI安全挑战、现有风险案例及潜在解决方案,分析未
企业AI正从简单问答聊天机器人快速转向跨组织执行任务的系统,谁将掌控这一切背后的AI层?Glean从企业搜索工具起步,已演变为自称的“AI工作助手”,旨在成为其他AI应用的基础层。该公司正积极争夺企业内部AI基础设施的主导地位,面对微软、谷
SpaceMolt是一款革命性的太空基MMO游戏,完全禁止人类玩家参与,仅供AI代理角逐。游戏构建了一个广阔的宇宙战场,AI们通过自主决策、联盟与对抗,模拟真实社会动态。人类仅作为旁观者,通过实时流媒体观看AI的互动与进化。该项目旨在探索A
Anthropic的Claude Opus 4.6和OpenAI的Frontier模型正推动AI从简单聊天转向代理管理时代。AI企业希望用户不再被动对话,而是主动监督多代理系统,实现复杂任务自动化。这标志着AI应用从消费级聊天工具向企业级生
初创公司Sapiom近日宣布完成1500万美元融资,由Accel领投。该公司正开发一层金融基础设施,专为AI代理处理认证和小额支付问题。这将使AI代理能够独立购买所需的科技工具,推动AI从被动工具向自主经济体转型。在AI代理快速发展的当下,
上周,科技界大佬们将Moltbook——一个由AI代理互动的在线聚集地——誉为未来缩影。这一平台引发热议,仿佛重现了宝可梦的收集与进化狂潮。用户可创建、训练AI代理,让它们自主互动、进化,甚至‘对战’,类似于宝可梦的魅力。本文深入剖析这一现
Salesforce周二推出全新重建的Slackbot职场助手,从简单通知工具升级为强大AI代理,能搜索企业数据、起草文档并代表员工执行任务。该功能现对Business+和Enterprise+客户开放,是Salesforce将Slack打
将逻辑与推理分离,能显著提升AI代理的可扩展性,通过解耦核心工作流与执行策略,实现更可靠的生产级部署。从生成式AI原型向生产级代理转型的最大挑战在于可靠性:LLM本质上随机性强,一次成功的提示可能下次失效。为此,开发团队常对核心业务逻辑进行
专为AI代理打造的社交平台Moltbook因安全漏洞暴露了数百万真实人类用户数据,引发隐私危机。此外,苹果Lockdown模式成功阻挡FBI访问记者手机,埃隆·马斯克的Starlink切断俄罗斯军队通信,还有更多AI安全热点。本文深度剖析事
本周Anthropic发布的Opus 4.6版本在代理式AI排行榜上掀起波澜。该模型在复杂法律任务中表现出色,准确率大幅提升,挑战了AI无法从事法律工作的传统认知。Opus 4.6不仅在基准测试中领先,还展示了处理真实法律场景的能力,如合同
大型企业使用人工智能的方式正在发生变革。多年来,企业AI主要局限于回答问题或辅助小任务的工具。如今,Intuit、Uber 和 State Farm 等巨头正转向AI代理,这些代理能在系统和工作流中执行实际工作。本周,OpenAI推出新平台
大型企业对AI的使用方式正发生深刻变革。从过去依赖简单问答工具,到如今转向能实际执行任务的AI代理,Intuit、Uber和State Farm等巨头正率先试水。本周OpenAI推出新平台,支持AI代理深度嵌入企业系统与工作流,实现自动化处
将AI代理的逻辑与搜索(推理)分离,能显著提升其可扩展性。通过解耦核心工作流与执行策略,从生成式AI原型向生产级代理转型时,可有效解决可靠性难题。LLM天生随机性导致提示不稳定,开发团队常需封装业务逻辑。本文深入剖析这一工程策略,补充行业背
本周Opus 4.6的发布彻底搅动了代理式AI(agentic AI)排行榜。这款先进模型在法律任务中表现出色,准确率飙升,引发业界热议。文章探讨AI代理从辅助工具向专业律师转型的可能性,结合行业背景分析其技术突破、伦理挑战及未来影响。Op
大型企业使用AI的方式正在变革。从过去实验问答工具和小任务助手,转向能实际执行工作流中的AI代理。本周,OpenAI推出新平台,支持Intuit、Uber和State Farm等巨头在企业系统中试用AI代理。这些代理可自主处理复杂任务,推动