AI 进化史 · EP 04

5天,100万用户。
这怎么可能。

2022年11月30日下午(PST)。OpenAI 悄然公开了一款聊天机器人。即便在公司内部也没有抱多大期待 —— 有人称它为 "research preview"。然而5天后,用户突破了100万。2个月后,达到1亿。它成为互联网历史上增长最快的产品。

6分钟阅读 2026.05.04 2018 → 2026

012018年,两家公司找到了相同的答案

2017年 Google 的 Transformer 论文(EP03)问世后,一个问题浮现出来 —— "如果用海量文本数据对 Transformer 进行预训练(pre-train),会发生什么?"

2018年,有两家几乎同时给出了答案。Google 于2018年10月发布了 BERT(Jacob Devlin 等)。采用双向训练 —— 同时观察一个单词的左右上下文。OpenAI 则比它早4个月,在6月发布了 GPT-1(Radford 等)。采用单向 —— 预测下一个单词的方式。

🎯 两条路的分岔
BERT 在理解(understand)任务上更强 —— 分类、检索、问答。GPT 在生成(generate)上更强 —— 写作、翻译、对话。在2018-2022年间,BERT 在工业界被使用得更多。然而2022年之后,一切都倒向了生成

022020年,OpenAI 证明了一个假设

OpenAI 研究团队于2020年发表的一篇论文 —— "Scaling Laws for Neural Language Models"。核心主张是:增大模型规模 × 数据 × 算力,性能就会以可预测的方式提升

为了证明这个假设,他们在同年5月公开了 GPT-3。参数高达1750亿个(175B)。是 GPT-2 的100倍。据外部分析估算,训练所耗费的 GPU 计算成本约为460万美元(Lambda Labs 估算)。

2018GPT-1
117M
2019GPT-2
1.5B
2020GPT-3
175B
2023GPT-4
~1.8T

GPT-3 是一记冲击。它能直接完成无人教过的翻译、摘要、写代码、写诗。"few-shot learning" —— 只要给出几个示例,它就能完成新的 task。看到这一点,OpenAI 内部 "这下真的有什么在发生" 的感觉变得更加坚定。

032022年11月30日,那一天的人们

OpenAI 取来 GPT-3.5,添加了一样东西 —— RLHF(Reinforcement Learning from Human Feedback)。由人直接评价模型的回答,再通过强化学习把这些评价反映到模型中。这样做出来的就是 InstructGPT,而它的对话版本就是 ChatGPT

🚀
Sam Altman · Ilya Sutskever · Greg Brockman
OpenAI 联合创始人 · 2015 - · ChatGPT 发布负责人

Sam Altman(CEO,Y Combinator 前总裁)、Ilya Sutskever(Chief Scientist,Hinton 的学生,在 EP01·02·03 中均出现过的那个人)、Greg Brockman(President,ex-Stripe CTO)。这三人拍板决定公开。即便在公司内部也只是当作 "research preview" 轻描淡写地对待 —— 然而结果并非如此。

5天
达到100万用户
所用的时间
2个月
达到1亿用户
所用的时间
$80B+
2024年 OpenAI
企业估值
$157B
2024年10月 OpenAI
企业估值(Series F)
📌 连 OpenAI 内部也未曾预料的爆发
Sam Altman 在 ChatGPT 公开几天后,亲自在 X(推特)上宣布了"5天100万用户"。即便在 OpenAI 内部,起初也把它称为 "low-key research preview",是一次小规模发布 —— 据此后多次采访证实,发布前的会议上没有任何人预料到会有这种规模的流量。

042023年,以及其他公司

2023年3月14日。OpenAI 公开了 GPT-4。技术规格未公开。它通过了美国律师资格考试(UBAR)的前10%,AP Calc BC 4分/5分、AP 化学 5分/5分等,在众多标准考试中取得了人类顶尖水平的成绩。关于模型规模的推测(1.8万亿参数、MoE 结构)四处流传,但 OpenAI 并未官方确认。

而且 —— 在 GPT-4 公开约2年前的2021年,一群从 OpenAI 出走的人创立了一家新公司。

🛡️
Dario & Daniela Amodei
Anthropic 联合创始人 · ex-OpenAI 副总裁 · Claude 系列

这是在 OpenAI 内主张应当更加重视"AI 安全(alignment)"的一群人。他们于2020年底离开 OpenAI,2021年初创立了 Anthropic。2023年3月推出 Claude 1,2024年6月推出 Claude 3.5 Sonnet —— 被评价为在编程能力上超越了 GPT-4

而后在2024-2025年,又一记冲击来自中国。

🇨🇳
Liang Wenfeng(梁文锋)
DeepSeek 创始人 · 量化对冲基金出身 · DeepSeek-R1 (2025.01)

他以与 OpenAI o1 相近的推理性能、却仅为1/30 的训练成本做出了 DeepSeek-R1。全部代码和 weights 都开源公开。美国大型科技公司的 GPU 军备竞赛假设本身受到了质疑 —— "真的需要这么贵吗?"

05那么 ChatGPT 时代的意义在于

截至2026年5月。ChatGPT 每周活跃用户超过5亿。加上 Claude·Gemini·Llama·Grok,已接近10亿。互联网本身正在这些模型之上被重新构建。Google 搜索正变成 LLM 回答,IDE 正变成 Copilot,企业内部的 ERP 正变成 RAG(将在 EP08 中讲述)。

🔑 一句话总结
ChatGPT 真正的冲击并不在于模型变聪明了 —— 而在于"任何人都能用自然语言向计算机下达指令了"。如果说1958年 Rosenblatt 的感知机(EP01)是 "机器会学习" 的开端,那么2022年的 ChatGPT 就是 "机器与人类对话" 的开端。

下一篇(EP05)将讲述2014年 Ian Goodfellow 在酒吧里灵光一现想到的 GAN,以及2020年从 DDPM(Diffusion)开始的图像·视频生成 AI 的12年史。如果说 ChatGPT 征服了语言,那么 Stable Diffusion·Sora·Veo 正在征服视觉。

🧪
亲自试试 · AI Lab
一句话是如何被切成 GPT token 的 →
"Hello world" 是2个 token。"안녕하세요" 是6-8个 token。表情符号是1-2个。输入一句话,亲自看看 GPT 如何切分、以及为什么韩语比英语更贵。
AI 进化史 · 系列导航