AI進化史 · EP 07

AIを作る工場も
すでにAIで動いている

GPT-4を学習させるNVIDIA H100 GPUは — TSMCとSamsungの工場で作られる。その工場は14週間にわたり200を超える工程を経て一枚のwaferを完成させる。各ステップごとに人が見守っているのか? いや、違う。その中でもAIが動いているのだ。

6分 read 2026.05.05 Industry · 産業応用

01まず — 半導体fabの本当のボトルネック

一枚のwaferには数百のlayerが積み重ねられる。各layerごとに厚さ・CD(critical dimension)・抵抗・欠陥の検査がある。もしすべてのwaferをすべてのステップで測定するなら — 測定だけでさらに14週間かかる。スループットが半分以下に落ちる。

だから現実は「サンプル測定」だ。25枚のうち1枚だけ測定する。運が悪ければ — 測定していない24枚の中に欠陥があっても、かなり後になって発見される。すでに次のステップまで進んだ後で。損失が積み重なる。

⚠️ サンプル測定の二つの損失
① 検出の遅れ — 最初のfailが発生した時点と発見された時点の間に処理されたwaferはすべて危険。平均12〜25枚が「すでに流れてしまった状態」で摘発される。
② 無測定ゆえの無知 — 96%のwaferは永遠に測定されない。統計的に正常だと仮定するが、分布の端にあるoutlierはそのまま出荷されうる。

ここにAIが入ってきた。「センサーデータはどのみちすべてのwaferで収集される。そのデータで測定値を予測できないだろうか?」 これが仮想計測(Virtual Metrology, VM)の出発点だ。そしてこの分野のグローバル初の量産システムが韓国から生まれた。

02SK hynix Panoptes — 韓国で始まったグローバル初の量産VM

🇰🇷
SK hynix × Gauss Labs · Panoptes
2018 開始 · 2020 本格展開 · DRAM/NAND fab 量産適用 · SPIE 2024

名前はギリシャ神話の100個の目を持つ巨人「Argus Panoptes」から取った。「すべてのwaferを100%見る」という意味だ。SK hynixの子会社Gauss Labsが開発し、中核アルゴリズムはPatch + Channel Independent Time-series Transformer(PatchTSTパターン)。各センサーを独立チャネルとしてpatch化して学習する。

SK hynixの利川(イチョン)・清州(チョンジュ)fabの一部のlayerで量産適用された。2024 SPIEで発表された後続技術が — Cross-Tool Attention:同じ種類のチャンバー複数台の間の共通パターンと装置ごとの特異性を同時に学習する。ある装置で学習したモデルが別の装置へtransfer可能になった。

現場検証 · 量産適用

03NVIDIA cuLitho — GPU企業がfabに入った理由

🇺🇸
NVIDIA cuLitho × TSMC · Samsung · ASML
2023.03 GTC 発表 · 2024 TSMC 本格導入 · 2025 Samsung 合流

EUVリソグラフィの中核ステップの一つがOPC(Optical Proximity Correction)だ。マスクパターンを、光が回折する効果を補正して描く — 一枚のマスクあたりCPUクラスタで2週間かかる作業。NVIDIAが2023年3月のGTCで発表したcuLithoは — 500台のNVIDIA DGX H100システムが4万台のCPUサーバーの作業量を代替し、一枚のマスクのOPCを2週間 → 約8時間へ短縮した。約40×の加速だ。

2023年GTC発表当時、TSMC、Samsung、ASMLが導入協業パートナーとして公式に公開された。2024〜25年にTSMCがcuLithoを量産OPCフローに統合し始め、Samsung・ASMLも同じ方向で作業を進めている。GPUがAIを作った後、今度はそのAIチップ自体を作る段階のスピードまでGPUが決めるのだ。

2週間 → 8時間(40× 加速)
📌 なぜcuLithoが必須になったのか
半導体ノードが小さくなるほど(2nm・1.4nm)OPCの計算量が指数的に増加する。既存のCPUクラスタでは一枚のマスクのOPCが2週間を超えるケースが出てくる — そうなるとチップ設計のスケジュール全体が遅れる。cuLithoのGPU加速がなければ次世代ノードの量産スケジュール自体が揺らぐ、というのが業界共通の認識だ。

04Samsung Hyper-Auto Fab + Omniverse Twin

🇰🇷
Samsung Semiconductor × NVIDIA Omniverse
2023 NVIDIA-Samsung 協力発表 · デジタルツイン基盤のfabシミュレーション

一つのfabを丸ごとデジタルツインにするという発想だ。ラインの装置・配管・ロボットの動線を仮想空間でシミュレーションする。新しいwaferが入ってくると、どの装置を通ってどの順序で進むのか — 仮想空間で事前にシミュレーション → 最も効率的な経路を選択 → 実際のfabに反映するという方向。SamsungはNVIDIA Omniverseを活用してこうした試みを公に進めている。

異常状況のシミュレーションも可能だ。あるEUV露光機がサービスから外れるとfab全体のスループットがどう変わるのか — 1秒で計算する。人間がスケジュールを組み直す前に、AIが先に次善の策を提示する。

デジタルツイン + リアルタイム最適化

05そして他の企業も — 皆が飛び込んだ

🇺🇸
Applied Materials ExtractAI
2022〜 · Optical ↔ SEM active learning

光学検査(速いが精度が低い)とSEM(遅いが精密)の間のギャップを埋めるactive learning loop。モデルが不確実だと判断した欠陥だけをSEMで検証 → モデルを再学習する。精度はSEM水準、速度は光学水準だ。

🇹🇼
TSMC · Heterogeneous Graph 基盤の歩留まりRCA
学術発表多数 · Graph Neural Network 基盤の yield analysis

あるlotの歩留まりが落ちると — chamber・tool・recipe・lotといった複数種類のノードでグラフを作り、各タイプごとに異なるattention/embeddingを置いて学習する。どのチャンバー × どのlotの組み合わせで欠陥が積み重なったのかを自動で突き止められる。人間が事後分析で数日かかっていたRCA(root cause analysis)を短く縮める方向性で、学界・産業の双方が活発に研究している。

🇺🇸
KLA Multi-Perspective DL Inspection
2023〜 · 回折・偏光・角度の多チャネル入力

一つの欠陥を見つける際に単一のRGB画像ではなく複数角度の回折・偏光チャネルを同時に入力する。CNNが4〜7個のチャネルを一緒に処理する。詳しいアルゴリズムは非公開だが — Multi-Perspective DLという名称はKLAの公式マーケティング資料に登場する。

06では結局どういう意味なのか

このシリーズをEP01から追ってきた人なら気づいたはずだ。すべてのアルゴリズムがここに集まる。EP01 backprop、EP02 CNN(検査)、EP03 Transformer(VM・RCA)、EP04 LLM(工場のコパイロット)、EP05 Diffusion(欠陥データの合成)、EP06 GPU/CUDA(cuLitho)。

もう一つ — これらすべての応用は学術的なSOTAではない。2017年のTransformer論文 → 2024年のSK hynix量産適用まで7年。学術 → 産業量産までには平均3〜5年のギャップがある。今、学界で話題のモデル(Mamba、FlashAttention 3)は — 2027〜2030年頃にfabに入ってくるだろう。

🔑 一行まとめ
AIを動かすためのGPUを作るfabは、そのfab自体がAIで動いている。EP01のHinton論文がEP02のAlexNetを経てEP06のGPUチップへ向かう間 — そのチップを作る工程のすべてのステップに、同じアルゴリズムが入っている。自分自身を作る道具が、自分自身で動く閉ループだ。

次回(EP08、最終回)ではこれらすべてのモデルを一般企業が自社データに適用する方法 — RAG(Retrieval-Augmented Generation)を扱う。2020年のPatrick Lewis論文から始まった一つのアイデアが、2026年にはすべての企業の社内コパイロットの標準になった物語だ。

🧪
自分で試す · AI Lab
仮想計測 — センサー値で厚さを予測してみる →
4つのセンサー(温度・圧力・ガス・RF)をスライダーで調整 → リアルタイムで厚さを予測。50枚のwaferを処理して予測精度の散布図まで描いてみてください。
AI進化史 · シリーズナビゲーション