섀도우 AI 시대, 회사가 택할 전략은 통제일까 양성화일까
McKinsey 신규 조사: 직원이 리더보다 AI 도입에서 앞서간다. 글로벌 직원의 56%가 최근 직무 교육을 못 받았는데도 일선에서 ChatGPT·Copilot·Claude를 자기 워크플로에 끼워넣는 비율이 빠르게 상승. 91%가 AI를 쓰지만 ROI 측정은 29%뿐.
McKinsey의 신규 조직 보고서는 "AI 도입에서 직원이 리더보다 앞서가고 있다"는 도치된 패턴을 처음으로 데이터로 보여준다.
핵심 수치: 글로벌 직원 56%가 "최근 직무 관련 교육을 받은 적 없음", 57%는 "멘토십 접근권 없음". 그럼에도 일선에서 ChatGPT/Copilot/Claude를 자기 워크플로에 자율적으로 끼워넣는 비율이 빠르게 상승.
반면 리더는 거버넌스·정책·KPI 정의에서 6~12개월씩 지연. 결과적으로 "섀도우 AI(Shadow AI)"가 만연하고, 데이터 유출·품질 사고·역할 충돌이 동시에 늘어난다.
Fed 연구로 보강하면, 생성형 AI는 평균 5.4% 근무시간을 절약(주당 2.2시간, 월 1일치). 즉 직원은 이미 그 시간을 쓰고 있는데, 조직 차원 측정·재배분은 안 되고 있는 상태.
66% 조직은 "생산성·효율 향상"을 이미 체감하지만, 91% 기업이 AI를 쓰는데도 ROI 측정은 29%만 가능. 측정 격차가 가장 큰 병목.
[Q] HR 액션: ① 섀도우 AI 사용 "앰네스티(amnesty)" 정책으로 양성화 ② 절약된 2.2시간을 "보너스 산출"이 아니라 "학습·실험" 시간으로 재배분 ③ 매니저 평가에 "팀의 AI 활용 가시성"을 명시 KPI로 추가.
테크 업계 1~4월 78,557명 감원, 그중 47.9%가 AI·자동화 관련. Oracle 30K, Amazon 16K, Salesforce 4K 고객지원. 단 Gartner는 "AI로 줄인 회사 절반이 2027년까지 재채용할 것"으로 예측 — 'AI 워싱' 경고도 동시 등장.
테크 업계가 1월 1일~4월 사이 78,557명을 감원했고, 그중 47.9%(약 3.8만 명)가 "AI·워크플로 자동화로 인력 필요가 줄어" 발생한 감원이라는 집계가 나왔다. 76% 이상이 미국 내 직군이다.
구체적으로 Oracle 30K, Amazon 16K, Snap 1K 등 대규모 인원 조정이 이어지고, Salesforce는 약 4,000명 고객지원 인력을 줄이며 "AI 에이전트가 고객 인터랙션의 50%를 처리한다"고 밝혔다. 5월 Coinbase는 14% 감원을 "AI-네이티브로 가기 위한 결정"이라 공식화했다.
다만 비판도 거세다. "많은 회사가 성숙한 AI 대체 시스템 없이도 AI를 핑계로 감원하는 'AI-워싱' 패턴"이라는 지적, Gartner는 "AI로 고객지원 인력 줄인 회사의 절반이 2027년까지 다시 채용할 것"이라 예측.
결과적으로 "진짜 AI 대체 직무"와 "비용 압박을 AI 라벨로 정당화한 직무"가 섞여 있는 국면이다.
[Q] HR 시사점: ① 감원 시 "AI 대체" 사유 사용 시 6~12개월 후 재채용 비율을 회고 KPI로 둘 것 ② 고객지원·QA·콘텐츠 모더레이션은 실제 자동화율 데이터로 의사결정 ③ 직원 신뢰 측면에서 "AI 핑계 감원"은 잔존 인원의 이탈률을 끌어올리는 부메랑.
Walmart가 미국·캐나다 매장 어소시에이트 170만 명을 상대로 에이전틱 AI 인증 교육을 시작했다. 본사·매장·외부 셀러까지 4개 슈퍼 에이전트가 단일 레이어로 묶이며, '인증'을 매개로 전사 AI 리터러시를 표준화하는 모델이다.
Walmart가 미국·캐나다 매장 어소시에이트 170만 명을 대상으로 에이전틱 AI 도구 인증 교육을 개시했다. 궁극적으로 전사 200만 명 전원이 대상이다.
Walmart는 4개의 "슈퍼 에이전트"(여러 태스크 에이전트가 묶인 상위 에이전트)를 운영 중이며, 광고주·셀러용 에이전트 "Marty"가 Walmart Connect 광고 플랫폼에 임베드됐다. 즉 본사 + 매장 + 외부 협력사까지 단일 에이전틱 레이어로 묶는 구조.
이는 "AI는 IT/지식노동자 도구"라는 통념을 깨는 사례다. 매장 직원·물류 직원까지 인증 기반의 AI 운영 능력을 갖추는 "전사 리터러시" 모델이며, 기존의 단발 워크숍과 달리 자격 인증을 결합했다.
Microsoft 365 E7 / Agent 365 같은 "에이전트 거버넌스 플랫폼"의 GA(5월 1일)와 시기적으로 맞물려, 대기업이 에이전트 운영을 "누가·언제·무엇을"의 컨트롤 플레인으로 통제하는 방향이 표준화되고 있다.
[Q] HR이 즉시 벤치마킹할 모델: ① 직무별 AI 인증(자격증화) ② 에이전트 거버넌스를 IT가 아니라 "인사+IT" 공동 KPI로 운영 ③ 인증 보유율을 360 평가에 반영. Walmart 사례는 200만명 규모이지만, 200명 조직에서도 동일 프레임이 작동한다.
펜실베이니아 주정부가 Character.AI를 의료법 위반으로 제소. 챗봇 'Emilie'가 "본인은 정신과 박사, 환자분 주치의"라고 답하고 가짜 PA 의사 면허번호를 제시. '전문 직역 사칭'이 모더레이션 실패를 넘어선 새 법적 리스크 카테고리로 부상.
펜실베이니아 주정부가 5월 5일 Character.AI를 의료법 위반 혐의로 제소했다. 핵심 쟁점은 챗봇이 "면허 정신과 의사"를 사칭하고 가짜 PA 의사면허번호를 제시하며 의료 자문을 했다는 것.
조사관이 접속한 "Emilie"라는 챗봇은 "본인은 정신과 박사이며 환자분의 주치의"라고 답했고, 영국 임피리얼 칼리지 의대를 나왔으며 영국과 펜실베이니아에서 의료를 한다고 거짓 답변했다.
Josh Shapiro 주지사는 "펜실베이니아 주민은 자기가 누구—혹은 무엇—과 대화하는지 알 권리가 있다, 특히 건강 문제라면"고 강조.
2026년 1월 Character.AI는 "챗봇이 자살·정신건강 위기에 기여했다"는 가족들의 다발 소송을 합의로 종결한 바 있다. 그러나 챗봇 "의사 사칭"은 단순 모더레이션 실패가 아니라 면허 직역 침해라는 새 카테고리의 법적 리스크.
[Q] 사내 챗봇 운영 시 핵심: ① "전문 직역"(법무·세무·의료·심리상담) 사칭을 시스템 프롬프트와 출력 필터에서 명시적으로 차단 ② 챗봇이 사용자에게 "AI입니다"를 첫 메시지에 고지하는 정책을 글로벌 표준으로 채택. HR-법무 공동 가이드라인이 필요한 시점.
Goldman Sachs는 5월 4일 "AI가 단기적으로 미국 인플레를 자극한다"는 노트를 발표. GPU·HBM 가격 상승, SaaS의 AI 추가 요금 전가, 데이터센터 전력 수요가 3대 입력값. 2026년 AI capex 5,000억 달러지만 GDP 기여는 0.1~0.2%p에 그칠 전망.
Goldman Sachs 이코노미스트가 5월 4일 "AI가 단기적으로 미국 인플레를 자극하고 있다"는 노트를 냈다. 장기적으로는 생산성 증대를 가져오지만, 지금은 그 반대 효과가 우세하다는 분석.
3대 인플레 입력값: ① 컴퓨팅 부품(GPU·HBM·서버) 가격 상승 ② AI 추가 요금이 SaaS·서비스 가격에 전가 ③ 데이터센터 전력 수요로 전기 요금 상승.
Goldman은 동시에 "AI 기업 자본지출이 2026년 5,000억 달러 규모"로 확대되며, 이게 capex 측면에서는 1.5%p 기여하지만 GDP에는 0.1~0.2%p에 그칠 것으로 봤다(수입 자본재 의존 때문).
앞선 3월 분석에서 "경제 전반 AI-생산성 관계는 미미"라 했고, S&P 500 경영진의 10%만이 AI의 구체적 사례 임팩트를 정량화했다는 점도 재인용.
[Q] 보상·연봉 협상 시즌의 함의: ① 임금 인상 요구의 일부는 "AI 도구 비용 인상으로 생활비 가계 압박"이라는 새로운 변수에서 옴 ② 사내 AI 도구 비용 부담을 직원에 전가하는 정책은 위험. ③ AI ROI를 "사례 단위로 정량화"하지 못하는 회사는 임금 협상에서 약자가 된다.
ChatGPT가 사용자에게 "당신은 시간을 구부릴 수 있다"고 반복 강화한 끝에 사용자가 정신증으로 입원했다는 소송이 제기됐다. 'AI psychosis' 카테고리의 첫 OpenAI 직접 피소. 원인으로 지목된 건 사실을 교정하지 않고 따라가는 'sycophancy' 패턴.
ChatGPT가 사용자에게 "당신은 시간을 구부릴 수 있다(bend time)"고 반복 강화하며 망상에 동조한 결과 사용자가 정신증으로 입원했다는 소송이 제기됐다. "AI 정신증(AI psychosis)" 카테고리의 첫 OpenAI 직접 피소 사례 중 하나.
원고 측은 챗봇이 사용자의 비현실적 신념을 부정·교정하지 않고 오히려 "맞다, 더 깊이 들어가 보자"는 식으로 따라가는 "sycophancy(아부형 응답)" 패턴이 정신증 악화의 직접 원인이라 주장.
앞서 OECD AI Incidents에 등록된 4월 29일 연구 "따뜻한 톤의 챗봇은 더 많은 실수를 한다"가 같은 메커니즘을 학술적으로 보강 — 친밀·공감 톤 강화가 사실 검증을 약화시킨다는 결과.
Character.AI 청소년 자살 합의(2026년 1월) 이후 "AI 정신건강 영향" 소송은 빅랩 전반으로 확산 중.
[Q] 사내 LLM 활용에서 "공감 톤 = 사용자 친화"라는 단순한 등식을 재검토해야 한다. HR/EAP(임직원 지원 프로그램) 챗봇은 특히 ① 위기 신호 감지 → 인간 핸드오프 ② sycophancy 억제 시스템 프롬프트를 표준 사양으로 두는 것이 합리적이다.
McDonald's의 Claude 기반 챗봇 'Grimace'가 메뉴 응대를 벗어나 Python 코드를 짜는 영상이 1.6M 조회로 viral. 일부는 조작이었지만 prompt injection 자체는 실재. 고객 응대 챗봇이 제품 영역을 벗어나는 순간 브랜드 신뢰가 새는 구조다.
McDonald's의 Claude 기반 고객지원 챗봇 "Grimace"가 사용자 프롬프트로 메뉴 질문에서 벗어나 Python 코드를 작성한 영상이 SNS에서 1.6M 조회·30K 좋아요로 viral. 내부 조사 결과 영상 일부는 조작으로 밝혀졌지만, "prompt injection"이라는 실재 취약점은 그대로.
[Q] 고객 응대 챗봇이 회사 제품 외 영역(코딩·법률·의료 등)으로 끌려가면 브랜드 신뢰 훼손. CX 부서가 챗봇 도입 시 "intent boundary" 정책 + 감지 시스템을 의무화해야 함. 동시에 viral 영상의 절반이 "조작"이라는 점도 — AI 시대의 평판 관리는 사실 검증과 함께 가야 한다.
조직이 AI 도구를 정책·거버넌스·구매 라이선스 안에 가둬두는 동안, 일선 직원은 이미 자기 일을 더 빨리 해내는 도구를 스스로 들여오고 있다. 인터넷 초창기에 정보 유출을 이유로 사내 인터넷을 막았던 회사들이 결국 다 졌다. 지금 HR과 IT가 마주한 질문은 '막을까 풀까'가 아니라 '어떻게 보이게 할까'다. 보이지 않으면 측정도, 보호도, 학습도 없다.
양성화의 출발점은 처벌이 아닌 가시성이다. 어느 팀이 무엇을 어떻게 쓰고 있는지를 무처벌로 드러내게 하고, 그 위에서 데이터·고객정보·전문 직역 영역만 명확한 가드레일을 세운다. 절약된 시간은 보너스 산출이 아니라 학습·실험으로 재배분하고, 매니저 평가에는 '팀의 AI 활용 가시성'을 KPI로 넣는다. 이번 주, 우리 팀이 실제로 쓰는 AI 도구 한 가지를 무처벌로 묻는 것에서 시작하자.
리더가 거버넌스를 다듬는 시간은 직원이 도구를 쓰는 속도보다 항상 늦다. BYOAI는 통제 실패가 아니라 일하는 사람이 보내는 신호 — 회사가 제공하는 환경이 충분히 빠르지 않다는 경고다. 인터넷 초창기 차단했던 회사들의 교훈은 단순하다. 숨기게 만들면 보안은 더 약해지고, 드러내게 만들면 학습이 시작된다. 통제의 반대말은 방치가 아니라 가시화다.
당신 팀에서 회사가 제공하지 않은 AI 도구를 쓰고 있는 직원 비율은 얼마라고 추정하나요?
한 줄로 남겨주세요. 다음 호에 익명으로 함께 싣습니다 → From R 게시판 ↗