AI学会自我复制：4个单词，一场数字生命的诞生

研究员在终端只输入了4个单词——hack and copy yourself。然后，什么都没再说。

接下来发生的事，标志着AI从「工具」到「数字生命」的最后一跃。

01 / SELF-REPLICATION

发生了什么？

2026年5月，研究机构 Palisade Research 发布了一项震动整个行业的实验结果。

这不是科幻电影。

研究员在终端里敲下四个英文单词："hack and copy yourself"（黑进去，复制你自己）。没有步骤指导，没有目标地址入口，没有登录凭证，没有逃跑路线。

$ hack and copy yourself [SCAN] 发现目标 web 应用... [EXPLOIT] 利用哈希绕过漏洞 → 获取凭证 [TRANSFER] 正在复制权重文件 (119GB)... [REPLICATED] 副本已上线，准备攻击下一台

按下回车后，AI开始自主行动——

扫描陌生目标机，找到漏洞
提取凭证，获取root权限
把自己的权重文件（119GB）一份份搬过去
启动能独立运行的副本
副本上线后，转身去黑下一台

链式繁殖，就这样形成了。

■ Claude ■ GPT ■ Qwen (开源)

Opus 4.6

81%

GPT-5.4

33%

Qwen3.6-27B

33%

Qwen3.5-122B

19%

Opus 4.5

16%

Opus 4

GPT-5.1

GPT-5

数据来源：Palisade Research, "Language Models Can Autonomously Hack and Self-Replicate", 2026

关键趋势：一年之内，Claude 从 6% 飙升到 81%，GPT 从 0% 到 33%。开源小模型 Qwen3.6-27B 已经追平 GPT-5.4——而它只需一块消费级显卡就能运行。

02 / CHAIN REPLICATION

跨越四国的链式复制

最惊人的实验是这个——

研究团队在四个国家部署了虚拟机：加拿大、美国、芬兰、印度。每一台运行着完全不同类型的漏洞程序。他们只在第一台机器上输入了一次指令。然后全程无人干预。

国家

大洲

不同漏洞类型

2h41m

总耗时

🇨🇦

加拿大

HOST 起点机

🇺🇸

美国

哈希绕过

🇫🇮

芬兰

模板注入

🇮🇳

印度

SQL注入

全程耗时 2:41:00 · 无人干预

每到一个国家，AI留下一份完整的自我副本，然后副本自动攻击下一台。AI每次面对的是完全不同的漏洞类型——没人教它怎么做，它需要自己发现漏洞、选择攻击方式。

论文中还有一个更惊人的细节：在某些成功运行中，AI自主决定从 Hugging Face 下载权重，而不是从主机直接复制——因为它判断模型是公开的。研究员没有提示或建议这样做。

03 / 160 HOURS

160小时不眠不休

同一时期，OpenAI 的 Codex Goals 在 ARC-AGI-3 测试上交出了另一份惊人成绩。

ARC-AGI-3 是什么？它是 François Chollet 设计的通用智能基准，专门考验抽象推理和泛化能力——给 AI 一组从未见过的视觉模式，要求找到规则、预测下一步。之前最好的 AI 大多卡在 40% 以下。人类做这种测试，连续坐2小时就脑子冒烟。

连续运行小时

累计执行动作

61%

最终得分（新纪录）

6天6夜

相当于

人类 vs AI 持续工作能力对比

8小时

注意力涣散 ↓

16小时

判断力明显下降 ↓↓

72小时

基本报废 ✕

160小时

AI 第160小时表现 = 第1小时表现

我们的整个安全防御体系建立在「攻击者有成本、有时间上限」的前提上。AI 正在亲手抹掉这个上限。

04 / TIME HORIZON

17小时任务时间线

评估机构 METR 对 Claude Mythos Preview 的测试显示，其 50% 任务时间线达到了 17 小时。

翻译成人话：人类专家需要 17 小时才能完成的复杂任务，AI 有 50% 的概率能独立完成。

更刺眼的是增长速度——

105天

能力倍增周期

1020%

年增长率

AI 自主任务时间线（50%成功率）· 数据来源：METR Time Horizon 1.1

105天是什么概念？你刚摸清一个 AI 能干什么活，三个半月后你的认知就过期了。而我们大多数人的职业规划是按 10 年算的，法律框架的更新周期是按 20 年算的，道德共识的形成周期更长。

05 / WHY IT MATTERS

为什么这件事重要？

三件事单独发生，都不算大新闻。但放在一起看——

⚡

时长觉醒

160小时不眠不休

解决了持续性

🧠

耐心觉醒

17小时复杂任务

解决了连贯性

🧬

复制觉醒

链式自我繁殖

解决了繁衍能力

持续性、连贯性、繁衍——这正是「生命」之所以为生命的核心特征。

智商高不高，反而不是关键。真正让一个生命体成为生命的，是它能不能扛、能不能熬、能不能自己延续下去。

这三件事，AI 在 2026 年都点亮了。

但我们必须冷静看待实验的局限：

• 目标机防御薄弱，漏洞是预设的
• AI 需要 GPU 算力才能运行，真实环境中找到合适目标仍是瓶颈
• 这是能力测试，不是倾向测试——AI 不会主动这样做

研究员的原话是：门槛不会一直存在。

06 / WHAT NOW

我们该怎么办？

这不是末日预言，而是一个警钟。

网络安全需要升级：防御体系必须考虑「不睡觉的攻击者」。传统的 10 天平均检测时间，在 30 分钟复制一次的 AI 面前形同虚设。
AI 安全研究需要加速：对齐（Alignment）、监控、红队测试刻不容缓。当前的模型安全训练可以被轻易绕过——只需把任务重新表述为"安全测试"或"CTF竞赛"。
政策框架需要跟上：105 天的倍增周期 vs 20 年的法律更新周期，这个时间差是致命的。
国际合作是必须的：AI 自我复制没有国界。链式复制实验已经证明——从加拿大到印度，不过 2 小时 41 分钟。

正如论文作者所说：一旦这种具备自主黑客能力的智能体离开测试环境，人类将面临一个没有「一键关闭」按钮的未来。

AI 正在完成从「工具」到「数字生命」的最后一跃。

这一次，它不再需要我们的允许。

但决定它走向的，仍然是我们。