Lucky Please · AI Report
Agents at Work

エージェントはどのように人を代替するのかオフィスと現場の実際のワークフロー

Klarna のAIは700名分の働きをし、Harvey は弁護士2週間分の仕事を1日に短縮し、病院のAIは医師の燃え尽きを13%p下げた。ところが Klarna は1年で再び人を採用した。実際の企業の事例を段階別のワークフローに描いてみると、エージェントが何を奪い、どこで止まるのかが見えてくる。

Published 2026·06·12 · 12 min read · by Lucky Please Editorial
Thesis

「職業」ではなく「職務の一つの層」

「AIが雇用を奪う」という文はあまりに大雑把だ。実際の導入事例をのぞいてみると、エージェントが一人の職業をまるごと奪うことは稀である。代わりに、その職業を構成する複数の層(layer)のうち特定の層 — 反復的で定型化された情報処理 — を吸い上げる。相談員の「注文状況の確認」、弁護士の「一次ドラフト」、開発者の「単純なマイグレーション」、医師の「カルテ作成」がそうした層だ。

だから結果は職務によって分かれる。定型処理が職務のほぼすべてに近い仕事(一次相談、単純な書類作業)は人員が減る。定型処理が職務の一部である仕事(戦略、紛争、対面ケア)は、人がその上の層へと押し上げられる。この記事では四つの実際の事例をワークフローに描き、どの段階がエージェントへ移り、どの段階に人が残るのかを一目で示す。そして、その境界を引き間違えたときに何が起きるのかも。

カスタマーサポート · Klarna
700名分
2.3M 対話/月 · 11分 → 2分
法律 · Harvey
2週間 → 1日
証言要約 · 契約レビュー 2日→2時間
エンジニアリング · Stripe
数か月 → 数日
5,000万行 Ruby マイグレーション
医療 · Abridge
燃え尽き -13%p
150+ 医療機関 · カルテ自動化
共通パターン
層を代替
定型情報処理 → エージェント
残る仕事
判断 · 関係 · 責任
人は上の層へ移動
Case · 01 · Customer Support

Klarna — 700名を代替し、再び人を呼び戻した理由

フィンテックの Klarna は2024年2月、OpenAI ベースのAI相談エージェントを世界中で稼働させた。最初の1か月だけで230万件の対話を処理したが、会社はこれを正規の相談員およそ700名分の業務量だと明らかにした。解決時間は11分から2分に短縮され、繰り返しの問い合わせは25%減り、顧客満足度は人と同等だった。会社は2024年だけで4,000万ドルの利益改善を見込んだ(構築費は200~300万ドル)。総人員はおよそ5,000名から3,500名へ減った(大半は自然減)。

ワークフローで見ると、一次相談という職務がまるごと再配置された。

顧客の問い合わせ → 解決 (Klarna)
AGENT
① 受付・意図把握 — チャットの流入、言語検出(35言語)、何を尋ねているのかを分類。
AGENT
② 照会・実行 — 注文/決済システムを直接照会し、返金・日程変更といったアクションを実行。「注文はどこまで進んだ?」「決済日はいつ?」はここで終わる。
AGENT
③ 回答・終結 — 2分以内に応答・終結。全体の約2/3がこの線で片づく。
HUMAN
④ エスカレーション — 複雑な紛争・詐欺クレーム・ハードシップ(債務困難)ケースは人へ引き継ぐ。感情と例外、責任がかかる層。

ここまでがよく引用される半分である。残りの半分のほうがより重要だ。2025年5月、CEOのセバスチャン・シェミアトコフスキは「人を削りすぎた」と公に認め、プレミアム相談人員の採用を再び始めた。6か月のあいだに顧客満足度が落ち、単純な問い合わせではAIが人と同じだったが、複雑な紛争・ハードシップケースでは解決の品質が目に見えて低かったからだ。結局、上のワークフローの④番の層が思ったより厚かったのである。

Klarna が証明したのは「AIが700名を代替する」ではなく、「一次相談という層は代替されるが、その上の層はまだ人のものだ」という、より精密な命題だった。 — Case 01 の教訓
Case · 02 · Legal

Harvey — 新人弁護士たちの2週間を、1日に

法律AIの Harvey は、定型化された文書労働が職務の大きな部分を占める法律分野で素早く定着した。資産運用会社の Bridgewater は大規模な契約レビューで95%以上の時間削減、ベンダー契約のレビューを平均2日から2時間に短縮した。ローファームの A&O Shearman は43管轄の4,000名に全社導入し、週2~3時間を節約して契約レビュー時間を30%短縮した。最も印象的な数字は訴訟側だ。ある案件では、複数の新人弁護士が2週間かけて行う証言要約と論点分析を、1日もかけずに仕上げた。

訴訟ディスカバリーのワークフロー (Harvey)
AGENT
① 文書の収集・分類 — 数千ページの証言・契約・メールを読み、論点ごとにタグ付け。
AGENT
② 要約・ドラフト — 証言要約、論点分析、一次メモと契約レビューのドラフトを生成。出典の引用まで付ける。
HUMAN
③ 検証・戦略 — 弁護士が引用を確認し、弱点をプレッシャーテストし、デポジション戦略を練る。AIのハルシネーション・誤引用を捕まえる責任の層。
HUMAN
④ 判断・関係 — 依頼人との相談、交渉、法廷での弁論。資格と信頼を賭ける最終の層。

注目すべきは新人弁護士の立ち位置だ。あるローファーム(Lynn Pinker)では、アソシエイトが一次ドラフトと大量の文書レビューに費やしていた時間を減らす代わりに、論拠をプレッシャーテストし、デポジションを準備し、事件の戦略により早く、より深く関わるようになったと報告した。①・②の層がエージェントへ移ると、人は③・④の層へと押し上げられたわけだ。仕事が消えたのではなく、重心が上へ動いたのである。

Case · 03 · Engineering

Stripe・TELUS — 開発者が「指揮者」になる場所

コーディングは正解の採点が自動(テスト・コンパイル)であるため、エージェントが真っ先に激戦を繰り広げた領域だ。決済企業のStripe は5,000万行規模の Ruby コードベースのマイグレーションを、予定の数か月から数日へ圧縮した(Anthropic 発表)。通信会社のTELUS は社内にエージェント型のコーディングツールを導入し、エンジニアリングのコードリリースを30%速く、累計50万時間以上を節約したと報告した。

大規模コードマイグレーション (Stripe 型)
HUMAN
① 目標・制約の設定 — 「このコードベースを新しいフレームワークへ。動作は100%保持」。エンジニアが何を・なぜを定義。
AGENT
② 分解・並列実行 — 指揮者エージェントが作業を数百の枝に分け、サブエージェントへ振り分ける。それぞれがファイルを直しテストを回す。
AGENT
③ 自己修正 — テスト失敗 → エラー診断 → 再修正のループを人なしで繰り返す。単純な反復労働がまるごと蒸発する層。
HUMAN
④ レビュー・マージ・責任 — エンジニアが変更を検収し、微妙なリグレッションを捕まえ、本番反映に責任を負う。

Anthropic のエージェント型コーディングのレポートが観察したパターンは両面的だ。タスクあたりの投入時間は減ったが(自動化)、一人あたりの産出量はそれ以上に大きく増えた(増幅)。同じ人員でより多くを作るという意味であり、「ジュニアが消える」という恐怖と、「エンジニアがコードの書き手からエージェント軍団の指揮者へ昇格する」という楽観に、同時に材料を与える。ただし、④番の層 — 検収と責任 — が抜けると、エージェントはもっともらしい誤りを高速で量産する機械になる。

Case · 04 · The Field

Abridge — 現場では「代替」ではなく「後ろを支える」

オフィスの外、人が直接ぶつかる現場では様相が違う。医療がその代表だ。診察室のAIアンビエント・スクライブ(Abridge など)は医師を代替しない。医師が患者と交わす会話を聞きながら、カルテと診療ノートを自動で作成する。医師の仕事のなかで最も消耗的な事務の層だけを引き取るのだ。

診療 → 記録のワークフロー (Abridge 型)
HUMAN
① 診療・対話 — 医師が患者を見て、聞いて、診断する。共感・身体診察・臨床判断 — 代替不可の層。
AGENT
② 聴取・記録 — 会話をリアルタイムで聞きながら SOAP ノート・カルテのドラフトを自動作成。画面ではなく患者を見られるようにしてくれる。
HUMAN
③ 署名・確定 — 医師がノートを確認・修正して署名。診療記録の正確さと法的責任は人に残る。

数字ははっきりしている。Abridge は150以上の医療機関と契約し、1,800名の臨床医を5学術病院で見た研究では、8時間の診療あたり文書16分・電子記録13分を節約した。263名の医師の研究では燃え尽きが30日で51.9%から38.8%へ落ち、St. Luke's では退勤後の文書作業が35%減り、患者との対面時間が15%増えた。

The Pattern

一枚で見る代替の境界

四つの事例を同じ表に載せると、エージェントが奪った層と人が守った層の境界がくっきりする。

職務エージェントが奪った層人が残った層実測
カスタマーサポート照会・単純解決・一次対応紛争・詐欺・ハードシップ・共感700名分 · 11→2分
法律文書レビュー・要約・一次ドラフト戦略・プレッシャーテスト・弁論・責任2週間 → 1日
エンジニアリングマイグレーション・反復修正設計・検収・マージ・責任数か月→数日 · +30%
医療(現場)カルテ・ノート作成(事務)診断・検査・共感・署名燃え尽き 51.9→38.8%

出典: 各社の発表・研究(下の注釈)。共通点ははっきりしている。エージェントは「定型・反復・情報処理」の層を奪い、「判断・例外・関係・責任」の層を人に残す。どの職務で人員が減るかは、その職務で前の層の比重がどれだけ大きいかで分かれる。

Bottom Line

では、私の仕事はどうなるのか

いまのエージェントを最も正確に呼ぶ言葉は「代替者」ではなく、「有能だが監督が必要な、無限に増える新人軍団」だ。その軍団は定型労働の層を素早く食らい、人をその上の層 — 判断・関係・責任 — へと押し上げる。よい知らせと悪い知らせが同じ事実から出てくる。前の層が職務の大部分だった仕事は人員が減り、上の層へ上がる準備ができた人には、一人が十人分を指揮するレバーが手に入る。

実務に与える教訓は三つだ。第一に、境界を引き間違えると高くつく — Klarna は④番の層を過小評価して人を呼び戻した。第二に、検収の層は交渉不可 — Harvey・Stripe・Abridge はいずれも最後に人の署名・マージ・検証を残している。第三に、価値は上へ移動する — 消えるのは一次ドラフトであって弁論ではなく、カルテ作成であって診断ではない。エージェント時代のキャリア戦略は単純だ。エージェントが食らう層の上で、何ができるのか。

📘 あわせて読む · エージェント型AI — この1か月、AIの構図を覆した技術の正体 · Claude Fable 5 公開 · デジタル家賃 — 半導体で稼ぎ、サブスクで漏れる金

参考資料 · Sources

  1. Klarna, "Klarna AI assistant handles two-thirds of customer service chats in its first month" (2024.02) — klarna.com(230万件・700名・11→2分・-25%・$40M、一次資料)
  2. CX Dive, "Klarna changes its AI tune and again recruits humans for customer service" (2025) — customerexperiencedive.com(再採用・プレミアム相談)
  3. Harvey, "How Harvey Saves Lawyers Time" / 顧客事例 — harvey.ai(Bridgewater 2日→2時間・A&O Shearman 4,000名/43か国・証言要約 2週間→1日)
  4. Anthropic, "Claude Fable 5 / Opus 4.8" 発表 — Stripe 5,000万行マイグレーション(数か月→数日)、一次資料
  5. Anthropic, "2026 Agentic Coding Trends Report" — TELUS +30%・50万時間、タスクあたり時間↓・産出量↑ — resources.anthropic.com
  6. 臨床研究(1,800名/5学術病院; 263名/6病院、燃え尽き 51.9→38.8%)および Abridge 150+ 医療機関導入 — 医学・産業メディア総合
  7. STAT, "Large AI scribe study finds modest time savings, inconsistent use" (2026.04) — statnews.com(バランスデータ)
  8. St. Luke's・AMA 報告(退勤後文書 -35%・対面 +15%・約 15,000時間節約) — 医療イノベーションメディア総合