AI 进化史 · EP 01

AI 死过两次。
也复活过两次。

1958 年登上《纽约时报》头版的"会自己学习的机器"—— 然而仅仅 11 年，它就被一本书宣判了死刑。又在 30 年的沉默之后，被 1986 年一篇论文唤醒。

5 分钟阅读 2026.05.04 1958 → 1986

011958 年 7 月，《纽约时报》头版

1958 年 7 月 8 日。《纽约时报》以大篇幅报道了美国海军实验室的一项发布 —— "NEW NAVY DEVICE LEARNS BY DOING"。在正文中，发布者这样说道。

"美国海军公开的这台电子装置，不久之后将成为能够自己行走、说话、看见、书写、并意识到自身存在的机器的开端。"

— New York Times, 1958.07.08

做出这一发布的人名叫 Frank Rosenblatt。他是康奈尔航空实验室（Cornell Aeronautical Laboratory）一位 30 岁的心理学家。他造出的机器拥有约 400 个光传感器，体积有一个巨大的柜子那么大，名为"Mark I Perceptron"。正如其名 ——"感知机（Perceptron）"，这正是人工神经网络的起点。

🧠

Frank Rosenblatt

1928–1971 · Cornell University · 心理学家 + 计算机科学家

他是第一个把"机器能像人一样识别模式"这一假设用硬件实现出来的人。他造出了一个单层神经网络，只要给它看一个字母，就能分辨出那是'A'还是'B'。研究经费由美国海军实验室提供。

感知机的工作原理很简单。把输入值乘以权重（weight），全部相加后若超过阈值就输出 1，否则输出 0。如果答案错了，就稍微调整权重。再试一次。再调整。—— 就这么简单。这正是 "机器从数据中自己学习" 这一概念首次开始运作的瞬间。

021969 年，一本书终结了一切

11 年后的 1969 年。MIT 的两位巨匠 ——Marvin Minsky 与 Seymour Papert 出版了一本书。书名就叫 《Perceptrons》。封面上有两个图形，中间是一个简单的问题。"这两个图形相同吗？"

📖

Marvin Minsky & Seymour Papert

MIT · "Perceptrons" (1969)

两人在书中用数学证明 —— 单层感知机 绝对无法解决 XOR 这样的非线性问题。也就是说，连"两个输入中恰好只有一个为真时才为真"这样简单的逻辑都学不会。这就是它的局限。

解决办法其实很明确。叠成多层（multi-layer）就行了。 可问题在于 ——"当层数有很多个时，要如何同时训练每一层的权重？"—— 这个问题没有人能回答。

⚠️ 第一次 AI 寒冬开始

研究经费开始枯竭。美国政府、英国政府、学术界 —— 全都对神经网络背过身去。此后 15 年间，神经网络研究实际上处于死亡状态。Frank Rosenblatt 于 1971 年死于一场划船事故。那天正是他的第 43 个生日。

031986 年，刊登于《Nature》的 6 页

1986 年 10 月。Nature 第 323 期，第 533–536 页。一篇仅有 6 页的论文刊登了出来。标题是 "Learning representations by back-propagating errors"。作者有三人。

⚡

David Rumelhart · Geoffrey Hinton · Ronald Williams

UC San Diego + Carnegie Mellon · Nature 1986

核心思想只有一句 ——"把微分的 chain rule 从输出端向输入端反向应用，一次性算出所有权重的梯度。"这就是我们所熟知的 反向传播（backpropagation）。

反向传播的意义很明确。如今 即便叠成多层也能完成学习了。Minsky 那个搁置了 17 年的批评 —— 解不开 XOR 的局限 —— 被解开了。多层神经网络时代的大门由此打开。

"这个算法太强大了，以至于 40 年后的今天，所有神经网络仍然以完全相同的方式学习。"

— ChatGPT、GPT-4、Stable Diffusion、Claude —— 全都是用 backprop 训练的

04然而它又一次沉睡了

反向传播被发明出来，并不意味着 AI 立刻就爆发了。整个 1990 年代，神经网络再次沦为边缘。原因有两个。

问题 ①

没有数据

要真正训练好一个神经网络，需要数十万到数百万张带标注的数据，可在 1990 年代，连数字照片都还不常见。

问题 ②

计算机太慢了

一次训练动辄要花上好几周。光靠 CPU，局限非常明显。在产业界，更简单的 SVM、决策树、HMM 占据了压倒性优势。

于是神经网络从 1990 年代后期一直到 2010 年前后，又一次度过了 第二次 AI 寒冬。只有学术界的一小部分人 —— Hinton、Yann LeCun、Yoshua Bengio —— 守住了那一点火种。他们后来被称为"深度学习教父"，并于 2018 年共同获得了图灵奖。

🔥 然后到了 2012 年，一切都变了

Hinton 的两位学生参加了 ImageNet 大赛。他们的名字是 Alex Krizhevsky 和 Ilya Sutskever。他们打造的模型 把错误率一举从 25% 降到了 16%。这个模型就叫'AlexNet'。从那一天起，AI 再也没有沉睡过。

05所以，说神经网络死过两次，是因为

1958 年一次，1990 年代又一次。而每一次，都是 一个人物 + 一篇论文 让它复活。1986 年是 Hinton 的反向传播，2012 年是 Krizhevsky 的 AlexNet。

如今我们所用的 ChatGPT、Stable Diffusion、自动驾驶、半导体工厂里的 AI —— 它们的根源，都在 1958 年 Rosenblatt 那台柜子大小的机器里。而它们的学习方式，正是 1986 年 Hinton 整理出的反向传播本身。

下一篇（EP02）将进入 1989 年 Yann LeCun 让机器识别手写邮政编码，由此开启的'CNN 时代'。他在 Bell Labs 造出的'LeNet'，又是如何在 30 年后一路延伸到我们手机的摄像头里的呢。

🧪

亲手试一试 · AI Lab

用按钮亲手运行一个神经网络的学习周期 →

一步步点击 Forward · Backward · Update，直观地看着损失一点点减小的过程。

AI 进化史 · 系列导航

← 上一篇

这是系列的第一篇

EP02 · 计算机拥有眼睛的 30 年故事