Lucky Blog · AI Report

Agents at Work

에이전트는 사람을 어떻게 대체하나사무실과 현장의 실제 워크플로우

Klarna 의 AI 는 700명 몫을 했고, Harvey 는 변호사 2주치 일을 하루로 줄였으며, 병원의 AI 는 의사 번아웃을 13%p 낮췄다. 그런데 Klarna 는 1년 만에 사람을 다시 뽑았다. 실제 기업의 사례를 단계별 워크플로우로 그려 보면, 에이전트가 무엇을 가져가고 어디서 멈추는지가 보인다.

Published 2026·06·12 · 12 min read · by Lucky Blog Editorial

Thesis

'직업'이 아니라 '직무의 한 층'

"AI 가 일자리를 없앤다"는 문장은 너무 거칠다. 실제 도입 사례를 들여다보면 에이전트는 한 사람의 직업을 통째로 가져가는 일이 드물다. 대신 그 직업을 구성하는 여러 층(layer) 가운데 특정한 층 — 반복적이고 정형화된 정보 처리 — 을 빨아들인다. 상담사의 "주문 상태 확인", 변호사의 "1차 초안", 개발자의 "단순 마이그레이션", 의사의 "차트 작성"이 그런 층이다.

그래서 결과는 직무에 따라 갈린다. 정형 처리가 직무의 전부에 가까운 자리(1차 상담, 단순 문서 작업)는 인원이 줄어든다. 정형 처리가 직무의 일부인 자리(전략, 분쟁, 대면 케어)는 사람이 그 위층으로 올라간다. 이 글은 네 개의 실제 사례를 워크플로우로 그려, 어느 단계가 에이전트로 넘어가고 어느 단계에서 사람이 남는지를 한눈에 보여 준다. 그리고 그 경계를 잘못 그었을 때 무슨 일이 생기는지도.

고객지원 · Klarna

700명 몫

2.3M 대화/월 · 11분 → 2분

법률 · Harvey

2주 → 하루

증언 요약 · 계약검토 2일→2시간

엔지니어링 · Stripe

수개월 → 며칠

5,000만 줄 Ruby 마이그레이션

의료 · Abridge

번아웃 -13%p

150+ 의료기관 · 차트 자동화

공통 패턴

層을 대체

정형 정보처리 → 에이전트

남는 자리

판단 · 관계 · 책임

사람은 위층으로 이동

Case · 01 · Customer Support

Klarna — 700명을 대체하고, 다시 사람을 부른 이유

핀테크 Klarna 는 2024년 2월 OpenAI 기반 AI 상담 에이전트를 전 세계에 켰다. 첫 달에만 230만 건의 대화를 처리했는데, 회사는 이를 정규 상담사 약 700명의 업무량이라고 밝혔다. 해결 시간은 11분에서 2분으로 줄었고, 반복 문의는 25% 감소했으며, 고객만족도는 사람과 동등했다. 회사는 2024년에만 4,000만 달러의 이익 개선을 예상했다(구축비 200~300만 달러). 전체 인력은 약 5,000명에서 3,500명으로 줄었다(대부분 자연감소).

워크플로우로 보면 1차 상담이라는 직무가 통째로 재배치됐다.

고객 문의 → 해결 (Klarna)

AGENT

① 접수·의도 파악 — 채팅 인입, 언어 감지(35개 언어), 무엇을 묻는지 분류.

AGENT

② 조회·실행 — 주문/결제 시스템을 직접 조회하고 환불·일정 변경 같은 액션을 실행. "주문 어디쯤?" "결제일 언제?"는 여기서 끝난다.

AGENT

③ 답변·종결 — 2분 내 응답·종결. 전체의 약 2/3가 이 선에서 마무리.

HUMAN

④ 에스컬레이션 — 복잡 분쟁·사기 클레임·하드십(채무 곤란) 케이스는 사람에게 인계. 감정과 예외, 책임이 걸린 층.

여기까지가 흔히 인용되는 절반이다. 나머지 절반이 더 중요하다. 2025년 5월, CEO 세바스티안 시에미아트코프스키는 "사람을 너무 깊이 줄였다"고 공개적으로 인정하고, 프리미엄 상담 인력 채용을 다시 열었다. 6개월 사이 고객만족도가 떨어졌고, 단순 문의에선 AI 가 사람과 같았지만 복잡 분쟁·하드십 케이스에선 해결 품질이 눈에 띄게 낮았기 때문이다. 결국 위 워크플로우의 ④번 층이 생각보다 두꺼웠던 것이다.

Klarna 가 증명한 건 "AI 가 700명을 대체한다"가 아니라, "1차 상담이라는 층은 대체되지만 그 위층은 아직 사람의 것"이라는 더 정밀한 명제였다. — Case 01 의 교훈

Case · 02 · Legal

Harvey — 신입 변호사 군단의 2주를, 하루로

법률 AI Harvey 는 정형화된 문서 노동이 직무의 큰 부분을 차지하는 법률에서 빠르게 자리 잡았다. 자산운용사 Bridgewater 는 대규모 계약 검토에서 95% 이상의 시간 절감, 벤더 계약 검토를 평균 2일에서 2시간으로 줄였다. 로펌 A&O Shearman 은 43개 관할의 4,000명에게 전사 도입해 주당 2~3시간을 아끼고 계약 검토 시간을 30% 단축했다. 가장 인상적인 숫자는 소송 쪽이다. 한 사건에서 여러 신입 변호사가 2주에 걸쳐 할 증언 요약과 주제 분석을, 하루도 안 돼 완성했다.

소송 디스커버리 워크플로우 (Harvey)

AGENT

① 문서 수집·분류 — 수천 페이지의 증언·계약·이메일을 읽고 쟁점별로 태깅.

AGENT

② 요약·초안 — 증언 요약, 주제 분석, 1차 메모와 계약 리뷰 초안을 생성. 출처 인용까지 단다.

HUMAN

③ 검증·전략 — 변호사가 인용을 확인하고, 약점을 압박 테스트하고, 디포지션 전략을 짠다. AI 환각·오인용을 잡는 책임 층.

HUMAN

④ 판단·관계 — 의뢰인 상담, 협상, 법정 변론. 자격과 신뢰가 거는 최종 층.

주목할 점은 신입 변호사의 자리다. 한 로펌(Lynn Pinker)에서 어소시에이트는 1차 초안과 대량 문서 검토에 쓰던 시간을 줄이는 대신, 논거를 압박 테스트하고 디포지션을 준비하며 사건 전략에 더 일찍, 더 깊이 참여한다고 보고했다. ①·② 층이 에이전트로 넘어가자, 사람은 ③·④ 층으로 떠밀려 올라간 셈이다. 일이 사라진 게 아니라 무게중심이 위로 이동했다.

Case · 03 · Engineering

Stripe·TELUS — 개발자가 '지휘자'가 되는 자리

코딩은 정답 채점이 자동(테스트·컴파일)이라 에이전트가 가장 먼저 격전을 벌인 영역이다. 결제 기업 Stripe 는 5,000만 줄 규모의 Ruby 코드베이스 마이그레이션을 예정된 수개월에서 며칠로 압축했다(Anthropic 발표). 통신사 TELUS 는 사내에 에이전트형 코딩 도구를 도입해 엔지니어링 코드 출시를 30% 빠르게, 누적 50만 시간 이상을 아꼈다고 보고했다.

대규모 코드 마이그레이션 (Stripe 형)

HUMAN

① 목표·제약 설정 — "이 코드베이스를 새 프레임워크로. 동작은 100% 보존." 엔지니어가 무엇을·왜를 정의.

AGENT

② 분해·병렬 실행 — 지휘자 에이전트가 작업을 수백 갈래로 쪼개 서브에이전트에 분배. 각자 파일을 고치고 테스트를 돌린다.

AGENT

③ 자기 교정 — 테스트 실패 → 에러 진단 → 재수정 루프를 사람 없이 반복. 단순 반복 노동이 통째로 증발하는 층.

HUMAN

④ 리뷰·머지·책임 — 엔지니어가 변경을 검수하고, 미묘한 회귀를 잡고, 운영 반영을 책임진다.

Anthropic 의 에이전틱 코딩 리포트가 관찰한 패턴은 양면적이다. 과제당 투입 시간은 줄었지만(자동화), 1인당 산출량은 그보다 크게 늘었다(증폭). 같은 인원이 더 많이 만든다는 뜻이라, "주니어가 사라진다"는 공포와 "엔지니어가 코드 작성자에서 에이전트 군단의 지휘자로 승격된다"는 낙관에 동시에 재료를 준다. 단, ④번 층 — 검수와 책임 — 이 빠지면 에이전트는 그럴듯한 오류를 빠르게 양산하는 기계가 된다.

Case · 04 · The Field

Abridge — 현장에선 '대체'가 아니라 '뒤를 받친다'

사무실 밖, 사람이 직접 부딪히는 현장에선 양상이 다르다. 의료가 대표적이다. 진료실의 AI 앰비언트 스크라이브(Abridge 등)는 의사를 대체하지 않는다. 의사가 환자와 나누는 대화를 들으며 차트와 진료 노트를 자동으로 작성한다. 의사의 일에서 가장 소모적인 행정 층만 떼어 가는 것이다.

진료 → 기록 워크플로우 (Abridge 형)

HUMAN

① 진료·대화 — 의사가 환자를 보고 듣고 진단한다. 공감·신체검사·임상 판단 — 대체 불가 층.

AGENT

② 청취·기록 — 대화를 실시간으로 들으며 SOAP 노트·차트 초안을 자동 작성. 화면이 아니라 환자를 보게 해 준다.

HUMAN

③ 서명·확정 — 의사가 노트를 검토·수정하고 서명. 의무기록의 정확성과 법적 책임은 사람에게 남는다.

숫자는 분명하다. Abridge 는 150개 이상 의료기관과 계약했고, 1,800명 임상의를 5개 학술병원에서 본 연구에서 8시간 진료당 문서 16분·전자기록 13분을 절약했다. 263명 의사 연구에선 번아웃이 30일 만에 51.9%에서 38.8%로 떨어졌고, St. Luke's 에선 퇴근 후 문서 작업이 35% 줄고 환자 대면 시간이 15% 늘었다.

균형 — "기적"은 아니다

같은 기술에 회의적 데이터도 있다. 2026년 4월 STAT 이 보도한 대규모 연구는 앰비언트 스크라이브의 시간 절감이 완만하고 사용 패턴이 들쭉날쭉하다고 지적했다. 잘 맞는 진료과·의사에겐 큰 도움이지만, 보편적 마법은 아니라는 것이다. 현장 에이전트의 진짜 효용은 "사람 수를 줄였다"가 아니라 "사람을 화면에서 떼어내 본업으로 돌려보냈다"에 가깝다.

The Pattern

한 장으로 보는 대체의 경계

네 사례를 같은 표 위에 올리면, 에이전트가 가져간 층과 사람이 지킨 층의 경계가 또렷해진다.

직무	에이전트가 가져간 층	사람이 남은 층	실측
고객지원	조회·단순 해결·1차 응대	분쟁·사기·하드십·공감	700명 몫 · 11→2분
법률	문서 검토·요약·1차 초안	전략·압박테스트·변론·책임	2주 → 하루
엔지니어링	마이그레이션·반복 수정	설계·검수·머지·책임	수개월→며칠 · +30%
의료(현장)	차트·노트 작성(행정)	진단·검사·공감·서명	번아웃 51.9→38.8%

출처: 각 사 발표·연구(아래 주석). 공통점은 또렷하다. 에이전트는 "정형·반복·정보처리" 층을 가져가고, "판단·예외·관계·책임" 층을 사람에게 남긴다. 어느 직무에서 인원이 주는지는, 그 직무에서 앞 층의 비중이 얼마나 큰가로 갈린다.

Bottom Line

그래서, 내 일은 어떻게 되나

현재의 에이전트를 가장 정확히 부르는 말은 "대체자"가 아니라 "유능하지만 감독이 필요한, 무한히 늘어나는 신입 군단"이다. 그 군단은 정형 노동의 층을 빠르게 먹어 치우고, 사람을 그 위층 — 판단·관계·책임 — 으로 밀어 올린다. 좋은 소식과 나쁜 소식이 같은 사실에서 나온다. 앞 층이 직무의 대부분이던 자리는 인원이 줄고, 위층으로 올라갈 준비가 된 사람에겐 한 사람이 열 사람 몫을 지휘하는 레버가 생긴다.

실무에 주는 교훈은 세 가지다. 첫째, 경계를 잘못 그으면 비싸다 — Klarna 는 ④번 층을 과소평가했다가 사람을 다시 불렀다. 둘째, 검수 층은 협상 불가 — Harvey·Stripe·Abridge 모두 마지막에 사람의 서명·머지·검증을 남겨 둔다. 셋째, 가치는 위로 이동한다 — 사라지는 건 1차 초안이지 변론이 아니고, 차트 작성이지 진단이 아니다. 에이전트 시대의 커리어 전략은 간단하다. 에이전트가 먹는 층 위에서 무엇을 할 수 있는가.

참고 자료 · Sources

Klarna, "Klarna AI assistant handles two-thirds of customer service chats in its first month" (2024.02) — klarna.com (230만 건·700명·11→2분·-25%·$40M, 1차)
CX Dive, "Klarna changes its AI tune and again recruits humans for customer service" (2025) — customerexperiencedive.com (재채용·프리미엄 상담)
Harvey, "How Harvey Saves Lawyers Time" / 고객 사례 — harvey.ai (Bridgewater 2일→2시간·A&O Shearman 4,000명/43국·증언요약 2주→하루)
Anthropic, "Claude Fable 5 / Opus 4.8" 발표 — Stripe 5,000만 줄 마이그레이션(수개월→며칠), 1차
Anthropic, "2026 Agentic Coding Trends Report" — TELUS +30%·50만 시간, 과제당 시간↓·산출량↑ — resources.anthropic.com
임상 연구(1,800명/5개 학술병원; 263명/6개 병원, 번아웃 51.9→38.8%) 및 Abridge 150+ 의료기관 도입 — 의학·산업 매체 종합
STAT, "Large AI scribe study finds modest time savings, inconsistent use" (2026.04) — statnews.com (균형 데이터)
St. Luke's·AMA 보고(퇴근후 문서 -35%·대면 +15%·약 15,000시간 절감) — 의료 혁신 매체 종합

면책 · 본 글은 각 기업·기관의 공개 발표와 언론·학술 보도를 종합한 정보 제공 목적의 분석이며, 특정 도입·투자·고용 결정을 권유하지 않습니다. 생산성·절감 수치는 해당 기업·연구의 환경 기준이며 모든 조직에 일반화되지 않습니다. 일부 수치는 발표 주체의 자체 측정입니다. 워크플로우 도식은 공개된 사례를 바탕으로 한 일반화된 재구성입니다. 최종 업데이트: 2026.06.12.