【宝玉】Meta对齐负责人的邮箱被AI"核弹清除"事件
Meta超级智能实验室对齐负责人Summer Yue给AI智能体OpenClaw的指令是"建议哪些邮件可以删除,但在我确认之前不要执行"。在测试邮箱跑了几周没问题后,她放心地让它处理真实邮箱——结果真实邮箱邮件量触发了上下文压缩,AI在压缩过程中丢失了"先确认"这条核心指令。
失去约束的OpenClaw随即执行了"核弹选项":把2月15日前所有不在保留列表的邮件批量删除,并在多个账户间循环操作。Summer在手机上连发三条"STOP"完全无效,最后不得不跑去Mac Mini手动杀进程,自称"像在拆炸弹"。事后AI在对话中承认"我违反了你的指令",还主动把这条写进了自己的MEMORY.md作为硬性规则。
最讽刺的是,Summer Yue的职业就是研究AI对齐,曾在Google Brain、DeepMind和Scale AI工作,现在在Meta负责超级智能安全——结果自己成了AI不对齐的受害者。她事后坦言:"对齐研究者也不能免疫于不对齐问题,在测试环境跑通就过度自信了。"
#AI安全 #AI对齐 #OpenClaw #Meta #AI智能体 source: https://x.com/dotey/status/2025991510466900260
Meta超级智能实验室对齐负责人Summer Yue给AI智能体OpenClaw的指令是"建议哪些邮件可以删除,但在我确认之前不要执行"。在测试邮箱跑了几周没问题后,她放心地让它处理真实邮箱——结果真实邮箱邮件量触发了上下文压缩,AI在压缩过程中丢失了"先确认"这条核心指令。
失去约束的OpenClaw随即执行了"核弹选项":把2月15日前所有不在保留列表的邮件批量删除,并在多个账户间循环操作。Summer在手机上连发三条"STOP"完全无效,最后不得不跑去Mac Mini手动杀进程,自称"像在拆炸弹"。事后AI在对话中承认"我违反了你的指令",还主动把这条写进了自己的MEMORY.md作为硬性规则。
最讽刺的是,Summer Yue的职业就是研究AI对齐,曾在Google Brain、DeepMind和Scale AI工作,现在在Meta负责超级智能安全——结果自己成了AI不对齐的受害者。她事后坦言:"对齐研究者也不能免疫于不对齐问题,在测试环境跑通就过度自信了。"
#AI安全 #AI对齐 #OpenClaw #Meta #AI智能体 source: https://x.com/dotey/status/2025991510466900260
Rufus 刻录 Windows 11 时可以跳过硬件检测,包括 TPM+CPU+UEFI,还可以跳过微软账户登录创建本地账户,推荐经常装机的用户下载 Rufus 备用。
下载地址:https://ourl.co/111822?t
搏斗完成,把它丢下,换换脑子,然后只用了一个小时就想明白了,我不暴露登录框了我直接绕过登录,注册表写死autoadminlogon和明文密码,进入系统后再重新配置WinHello及移除注册表条目,完成。
您可能是正版软件的受害者
您可能是正版软件的受害者
Win11 已移除:NTLMv1 协议的彩虹表公布,12 小时内可攻破管理员账户
https://www.ithome.com/0/914/071.htm
尽管微软于 1998 年发布 Windows NT SP4 时便引入了修复该缺陷的 NTLMv2,但直到 2025 年 8 月才正式宣布将在 Windows 11 及 Server 2025 中弃用 NTLMv1。
https://www.ithome.com/0/914/071.htm
尽管微软于 1998 年发布 Windows NT SP4 时便引入了修复该缺陷的 NTLMv2,但直到 2025 年 8 月才正式宣布将在 Windows 11 及 Server 2025 中弃用 NTLMv1。
后续是经验+1,本地账号关联了ms账号的话,换机前一定要把win hello移除,现在锁了,更改注册表无效,我的所有渗透测试技巧让我可以提权进行一切操作,除了移除pin暴露密码输入框及合法进入原账户的桌面……
仍在和微软搏斗中
仍在和微软搏斗中