AI编程工具酿祸：数千应用泄露企业及个人数据

2026年5月7日 17 约4分钟 WIRED

AI安全数据泄露氛围编码 Web应用安全开发者工具

当AI编程工具让“人人都是开发者”成为现实，数据泄露也迎来了“工业化”时代。

从“一键生成”到“一键泄露”

据WIRED报道，安全研究人员近期发现，在Lovable、Base44、Replit、Netlify等AI驱动的应用构建平台上，有数以千计由AI“氛围编码”（vibe-coding）生成的Web应用，正在将企业核心数据和个人隐私信息直接暴露于公共互联网之下。这些应用本应由开发者精心构建，但AI生成的代码往往忽略了最基本的安全配置基础——环境变量、访问控制、敏感信息加密等。

“你让AI帮你写一个应用，AI在10秒内生成了代码，同时也生成了通往你数据库的敞开大门。”——安全研究员Daniel Mayer

所谓“氛围编码”，是指开发者通过自然语言描述需求，由AI模型（如GPT-4o、Claude等）自动生成完整的前后端代码，再一键部署到云平台。这一流程在过去两年间极大地降低了Web开发门槛，使得非技术人员也能快速搭建产品原型、企业内部工具甚至面向客户的服务。然而，便利性的另一面是安全隐患的指数级增长。

数据泄漏的“冰山一角”

安全团队对公开可访问的互联网进行扫描后发现，这些AI生成的应用中，有大量直接嵌入了硬编码的数据库连接字符串、云服务API密钥、第三方支付令牌，甚至包括用户的姓名、邮箱、家庭地址等敏感信息。其中一个典型案例是某初创公司使用AI为其内部管理系统生成的数据库面板，由于未设置任何身份验证，任何知道URL的人都可以直接查看和编辑公司的客户合同信息。

研究人员指出，这种现象并非孤立事件。在Lovable上，有超过20%的公开部署应用存在至少一个可被公开访问的敏感端点；在Replit上，大量AI生成的Python Flask应用直接将环境变量写入了前端JS文件。而Base44和Netlify作为部署平台，也未能有效阻止此类问题的扩散。

为何AI生成的代码更容易“裸奔”？

深层原因在于当前的AI开发范式缺乏“安全内置”的基因。大多数AI模型训练数据来自公开的代码仓库（如GitHub），其中本身就包含大量不安全的实践。AI学习到的“最佳实践”往往是功能优先、安全滞后的模式。更关键的是，使用AI的开发者许多并非专业安全工程师，他们天然地信任AI的输出，认为“AI生成的代码应该没问题”，从而跳过了人工审计这一关键环节。

此外，AI平台往往鼓励快速迭代和即时部署。在“氛围编码”理念下，用户从输入一句“帮我做一个客户管理系统”到应用上线，可能只需要5分钟。在这5分钟里，没有安全审查、没有权限校验、没有渗透测试——一切都被效率主义所淹没。

“这不是AI的错，是使用AI的人类放弃了安全责任。”安全分析师陈薇点评道，“就像你让自动驾驶开车，但没系安全带就上了路。”

行业反思与补救措施

事件曝光后，Lovable迅速发布了安全改进声明，宣布将自动扫描部署应用的源代码，对硬编码凭据、缺少认证的端点进行预警。Replit也更新了其AI编码助手的安全指导，强制要求用户在使用敏感API时启用环境变量加密。Netlify则承诺将引入更严格的部署前安全沙箱。

然而，这些事后补丁能否解决根本问题，仍存疑虑。安全专家呼吁：AI工具本身应当承担起“默认安全”的责任，例如在生成代码时就强制添加认证中间件、自动检测和警告敏感信息硬编码、提供一键式安全配置向导。而在政策层面，也需要尽快明确AI生成代码的安全责任归属：当AI造成的漏洞导致用户数据泄露时，平台方、AI模型提供商还是开发者承担主要责任？

对于普通企业和个人开发者而言，最直接的教训是：永远不要信任AI生成的代码安全。无论你的应用是用20分钟还是2秒钟构建的，在上线之前，必须像对待传统代码一样进行至少一次安全审计。那些数据库凭据、API密钥，应该像银行卡密码一样被妥善保管——而不是躺在Git提交历史或JS控制台的“开发模式”中。

编者按

“氛围编码”正在重塑软件开发的面貌，但本次大规模数据泄露事件表明：当开发门槛降低到“人人可写”时，安全问题也从专业开发者的责任变成了整个互联网的基础设施风险。AI工具或许能够写出功能完美的代码，却还不能写出“懂得保护自己”的代码。要真正让AI赋能安全，而不是成为安全的放大器，需要平台、开发者、安全社区三方的协同进化。

本文编译自WIRED

AI编程工具酿祸：数千应用泄露企业及个人数据

从“一键生成”到“一键泄露”

数据泄漏的“冰山一角”

为何AI生成的代码更容易“裸奔”？

行业反思与补救措施

编者按

相关文章