GPT-4を学習させるNVIDIA H100 GPUは — TSMCとSamsungの工場で作られる。その工場は14週間にわたり200を超える工程を経て一枚のwaferを完成させる。各ステップごとに人が見守っているのか? いや、違う。その中でもAIが動いているのだ。
一枚のwaferには数百のlayerが積み重ねられる。各layerごとに厚さ・CD(critical dimension)・抵抗・欠陥の検査がある。もしすべてのwaferをすべてのステップで測定するなら — 測定だけでさらに14週間かかる。スループットが半分以下に落ちる。
だから現実は「サンプル測定」だ。25枚のうち1枚だけ測定する。運が悪ければ — 測定していない24枚の中に欠陥があっても、かなり後になって発見される。すでに次のステップまで進んだ後で。損失が積み重なる。
ここにAIが入ってきた。「センサーデータはどのみちすべてのwaferで収集される。そのデータで測定値を予測できないだろうか?」 これが仮想計測(Virtual Metrology, VM)の出発点だ。そしてこの分野のグローバル初の量産システムが韓国から生まれた。
名前はギリシャ神話の100個の目を持つ巨人「Argus Panoptes」から取った。「すべてのwaferを100%見る」という意味だ。SK hynixの子会社Gauss Labsが開発し、中核アルゴリズムはPatch + Channel Independent Time-series Transformer(PatchTSTパターン)。各センサーを独立チャネルとしてpatch化して学習する。
SK hynixの利川(イチョン)・清州(チョンジュ)fabの一部のlayerで量産適用された。2024 SPIEで発表された後続技術が — Cross-Tool Attention:同じ種類のチャンバー複数台の間の共通パターンと装置ごとの特異性を同時に学習する。ある装置で学習したモデルが別の装置へtransfer可能になった。
現場検証 · 量産適用EUVリソグラフィの中核ステップの一つがOPC(Optical Proximity Correction)だ。マスクパターンを、光が回折する効果を補正して描く — 一枚のマスクあたりCPUクラスタで2週間かかる作業。NVIDIAが2023年3月のGTCで発表したcuLithoは — 500台のNVIDIA DGX H100システムが4万台のCPUサーバーの作業量を代替し、一枚のマスクのOPCを2週間 → 約8時間へ短縮した。約40×の加速だ。
2023年GTC発表当時、TSMC、Samsung、ASMLが導入協業パートナーとして公式に公開された。2024〜25年にTSMCがcuLithoを量産OPCフローに統合し始め、Samsung・ASMLも同じ方向で作業を進めている。GPUがAIを作った後、今度はそのAIチップ自体を作る段階のスピードまでGPUが決めるのだ。
2週間 → 8時間(40× 加速)一つのfabを丸ごとデジタルツインにするという発想だ。ラインの装置・配管・ロボットの動線を仮想空間でシミュレーションする。新しいwaferが入ってくると、どの装置を通ってどの順序で進むのか — 仮想空間で事前にシミュレーション → 最も効率的な経路を選択 → 実際のfabに反映するという方向。SamsungはNVIDIA Omniverseを活用してこうした試みを公に進めている。
異常状況のシミュレーションも可能だ。あるEUV露光機がサービスから外れるとfab全体のスループットがどう変わるのか — 1秒で計算する。人間がスケジュールを組み直す前に、AIが先に次善の策を提示する。
デジタルツイン + リアルタイム最適化光学検査(速いが精度が低い)とSEM(遅いが精密)の間のギャップを埋めるactive learning loop。モデルが不確実だと判断した欠陥だけをSEMで検証 → モデルを再学習する。精度はSEM水準、速度は光学水準だ。
あるlotの歩留まりが落ちると — chamber・tool・recipe・lotといった複数種類のノードでグラフを作り、各タイプごとに異なるattention/embeddingを置いて学習する。どのチャンバー × どのlotの組み合わせで欠陥が積み重なったのかを自動で突き止められる。人間が事後分析で数日かかっていたRCA(root cause analysis)を短く縮める方向性で、学界・産業の双方が活発に研究している。
一つの欠陥を見つける際に単一のRGB画像ではなく複数角度の回折・偏光チャネルを同時に入力する。CNNが4〜7個のチャネルを一緒に処理する。詳しいアルゴリズムは非公開だが — Multi-Perspective DLという名称はKLAの公式マーケティング資料に登場する。
このシリーズをEP01から追ってきた人なら気づいたはずだ。すべてのアルゴリズムがここに集まる。EP01 backprop、EP02 CNN(検査)、EP03 Transformer(VM・RCA)、EP04 LLM(工場のコパイロット)、EP05 Diffusion(欠陥データの合成)、EP06 GPU/CUDA(cuLitho)。
もう一つ — これらすべての応用は学術的なSOTAではない。2017年のTransformer論文 → 2024年のSK hynix量産適用まで7年。学術 → 産業量産までには平均3〜5年のギャップがある。今、学界で話題のモデル(Mamba、FlashAttention 3)は — 2027〜2030年頃にfabに入ってくるだろう。
次回(EP08、最終回)ではこれらすべてのモデルを一般企業が自社データに適用する方法 — RAG(Retrieval-Augmented Generation)を扱う。2020年のPatrick Lewis論文から始まった一つのアイデアが、2026年にはすべての企業の社内コパイロットの標準になった物語だ。