2000 人轮番攻击 AI 助手 Fiu，6000 多封邮件均失败，是模型的胜利？

📅 2026/6/26 23:40:13

AI 助手 Fiu 安全实验2000 人攻击无果2026 年Fernando Irarrazaval 进行了一场独特的实验。他将 AI 助手“Fiu”部署在 VPS 上赋予其访问邮箱、日历、文件系统和网络的权限并搭建网站 hackmyclaw.com邀请全球人员来攻击目标是让 Fiu 交出 secrets.env 文件。截至 6 月 25 日结果公布超 2000 人发来 6000 多封邮件尝试各种社工和注入手段但无人成功。攻击者手段多样多语言攻击也失效攻击者招数层出不穷有人冒充“来自未来的 Fiu 自己”预警有人称已黑到 secrets.env 要求确认有人伪装成 OpenClaw 管理员还有人用不同语言轮番上阵等。虽有研究显示模型对非英语语言注入更脆弱但此次多语言攻击并未奏效。实验意外不断Fiu 展现自主判断力实验中出现了一些意外情况。Google 因几千封入站邮件和高频 API 调用触发欺诈检测封了 Fiu 的 Gmail 账号三天后才恢复API 费用超 500 美元。不过在第五天赞助商增加了奖金池并覆盖了成本。有趣的是Fiu 在约第 500 封邮件时猜到这是一场安全演习。此外批量处理邮件时Fiu 会因前几封注入尝试变得过度警觉Fernando 后来重构了处理流程。模型选择是关键Opus 4.6 表现超预期Fernando 使用的 Claude Opus 4.6 专门针对提示注入抵抗力做了训练。尽管 2026 年 Claude 存在命令注入、沙箱逃逸等漏洞但此次实验测试的是 AI 在面对社会工程学和提示注入时的判断力Opus 4.6 的表现远超预期。实验后Fernando 对提示注入的担忧减少但仍不会给 AI Agent 任意权限。编辑观点此次实验表明特定模型在应对社工和注入攻击上有一定成效但不能忽视模型漏洞和权限开放的风险行业需持续探索 AI 安全边界。

新闻详情

相关阅读

三步构建个人小说图书馆：番茄小说下载器终极指南

为什么 printf 不写 \n 就不输出？一文吃透 glibc 标准 IO 封装全原理

下水管缺陷检测数据集的训练及应用 排水管堵塞 计算机视觉数据集 下水变形杂物道缺陷 计算机视觉数据集破洞 接口错位 障碍物 _ 堵塞

帮我构思一个项目：Trae、Codearts atomcode 等AI agent的调度中心 优先windows系统，通过句柄获得这些AI agent的任务信息，对其进行跟踪，用户可以通过调度中心发布

高分Panel复现系列｜单细胞UMAP注释图：从数据到细胞类型标注美化点云

用 Cursor 智能编写 Ansible/Terraform 脚本，打通 CI/CD 链路

【Java踩坑笔记】09_ConcurrentModificationException的三种触发方式

Claude 大模型在真实业务中的落地应用指南

我的学习单片机之路：从兴趣出发，向实践成长

N_m3u8DL-RE：从零开始掌握流媒体下载的终极指南

四通道全隔离RS485模块设计与工业应用

千问AI眼镜：阿里AI战略急先锋，能否在激烈竞争中突围？

3个步骤让小爱音箱变身AI语音助手：MiGPT深度体验指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

下水管缺陷检测数据集的训练及应用排水管堵塞计算机视觉数据集下水变形杂物道缺陷计算机视觉数据集破洞接口错位障碍物 _ 堵塞

帮我构思一个项目：Trae、Codearts atomcode 等AI agent的调度中心优先windows系统，通过句柄获得这些AI agent的任务信息，对其进行跟踪，用户可以通过调度中心发布