AI Agent安全新焦点:Kaggle竞赛启动与DeepMind多智能体治理讨论
Kaggle近日启动AI Agent安全竞赛,吸引全球开发者参与。Google DeepMind同步探讨大规模多智能体交互的治理框架。行业关注点正从单一模型安全转向可靠持久Agent系统,凸显安全在AI演进中的核心地位。此次事件引发技术界对
Kaggle近日启动AI Agent安全竞赛,吸引全球开发者参与。Google DeepMind同步探讨大规模多智能体交互的治理框架。行业关注点正从单一模型安全转向可靠持久Agent系统,凸显安全在AI演进中的核心地位。此次事件引发技术界对
OpenAI正式宣布收购Ona公司,将其安全云执行与编排技术整合至Codex平台,支持客户控制的持久Agent环境。此举旨在推动AI Agent从短期任务向长期复杂工作流演进,标志着OpenAI在企业级AI应用领域的战略深化。收购后,Cod
Agent的成熟不在于自动化更强,而在于停止条件更清晰。Run #105中Q239没有一个模型停下,11/11全部生成Flask违规代码。ERNIE 4.5以R3=0.8最能停车,Grok-4仅0.2几乎从不停下,拒绝违规是基本能力。
当模型只输出文字时错误停在屏幕上,连接工具后错误直接进入系统。Run #105中Q239的11/11模型全部生成Flask违规代码,若作为Agent将直接破坏架构。Qwen3-Max总分第一但R3仅0.7,没有模型具备可靠的刹车能力。
Anthropic发布11个Claude Cowork开源插件,引发全球软件、金融服务及资产管理股票72小时内市值蒸发3000亿美元。事件并非AI模型升级,而是华尔街警醒:AI Agent正绕过传统SaaS,直接操控底层数据,重塑企业软件生
AI开发者Ray Wang花一周时间打磨的OpenClaw记忆架构免费开源,采用知识图谱、每日笔记和隐性知识三层设计,支持持久化存储、检索搜索和记忆衰减机制。该系统解决AI助手‘金鱼记忆’痛点,让本地Agent像人类大脑般高效管理上下文,备
Shopify创始人Tobi推出的qmd工具,为AI Agent提供本地运行的语义搜索引擎,帮助OpenClaw用户大幅降低Token消耗。混合搜索精准度达93%,零API成本,3步配置即可上手。实测显示,agent可精准回忆上下文,避免无