Managed Agents, Anthropic의 전략적 베팅 6개

Anthropic의 새 제품을 한 층 아래에서 뜯어보면서 정리한 관찰 노트.

Anthropic이 Claude Managed Agents를 출시했다. 블로그와 홍보 문구만 보면 에이전트 구축을 쉽게 해주는 관리형 인프라 정도로 요약된다. 에이전트 설정을 템플릿으로 정의하고, 샌드박스를 자동으로 프로비저닝하고, 장기 실행 작업을 안정적으로 복구한다. 이 수준에서 멈추면 AWS Lambda의 AI 에이전트 버전처럼 읽힌다.

그런데 관련 문서와 엔지니어링 블로그를 여러 번 읽으면서 생각이 조금 바뀌었다. 이건 단순한 제품 출시가 아닌 것 같다. 한 층 아래에서 보면 Anthropic이 앞으로 2~3년간 어떤 게임을 하려는지에 대한 선언문에 가깝다는 생각이 들었다. 그 선언 안에 최소 여섯 개의 서로 다른 전략적 베팅이 하나의 번들로 묶여 있다. 각각은 독립적으로도 합리적이지만, 여섯 개가 합쳐졌을 때 나오는 전략적 효과가 훨씬 크게 느껴진다.

내가 뜯어본 여섯 개의 베팅을 하나씩 정리해본다. 각 베팅은 Anthropic이 명시적으로 말한 것도 있고, 제품 설계 안에 암시적으로 박혀 있다고 내가 해석한 것도 있다.

토큰을 더 많이 태우게 만드는 쪽으로

순수 모델 API는 빠르게 평준화되는 중이다. DeepSeek, Qwen, Llama가 턱밑까지 쫓아왔고, 토큰 단가는 분기마다 내려가는 중이다. 이 방향에서는 누구도 장기적으로 이기기 어렵다. Anthropic이 모델 성능에서 우위를 유지하고 있어도, 단가 경쟁 자체가 기업 가치의 상한을 눌러버린다.

여기서 Managed Agents가 내가 보는 첫 번째 베팅을 한다. 토큰 소비 구조를 직접 설계해서 규모 경쟁으로 판을 옮기는 것이다. 채팅 한 번이 수천 토큰을 쓴다면, 에이전트 한 세션은 수십만에서 수백만 토큰을 쓴다. 장기 자율 실행 에이전트는 한 세션에 수억 토큰을 쓸 수 있다. 에이전트 런타임을 직접 소유한다는 건 Claude가 얼마나 많이 생각하게 할지를 Anthropic이 직접 통제할 수 있다는 뜻으로 읽힌다.

같은 토큰을 파는 회사여도, 토큰 소비 구조를 설계할 수 있는 회사와 없는 회사는 다른 게임을 하는 것 같다. Managed Agents 이후의 Anthropic은 후자에서 전자로 넘어가려는 것처럼 보인다.

토큰 소비 규모 비교: 채팅 1회(수천) vs 에이전트 1세션(수십만~수백만) vs 장기 자율 에이전트(수억+). 같은 토큰을 파는 회사여도, 소비 구조를 설계할 수 있는 쪽은 다른 게임을 한다.

실행 궤적이라는 새로운 해자

이 부분이 내가 가장 인상 깊게 본 베팅이다. Messages API는 Anthropic에게 두 가지만 보여준다. 사용자가 넣은 프롬프트와 모델이 반환한 응답. 그 사이에 일어난 일은 전부 외부 하네스의 내부 상태이기 때문에 Anthropic이 접근할 수 없다. 지난 2년간 Cursor, Cognition, Replit 같은 회사들이 이 공백 위에서 자기 가치를 쌓았다. 에이전트가 어떤 도구를 몇 번 호출했는지, 어디서 막혔는지, 어떻게 실패를 복구했는지는 전부 그 회사들의 자산이었다.

Managed Agents는 이 공백을 직접 메우는 설계로 읽힌다. 세션이 append-only 이벤트 로그로 기록되면서, 에이전트의 전 실행 궤적이 Anthropic의 인프라 안에 쌓인다. 이 데이터는 차세대 Claude 모델을 학습시킬 때 결정적인 자산이 될 가능성이 크다. 정답만 있는 지도학습 데이터와 달리, 실행 궤적은 어떤 생각의 경로가 실제로 문제를 풀었는가에 대한 고품질 신호이기 때문이다.

OpenAI가 ChatGPT로 소비자 피드백을 독점했다면, Anthropic은 Managed Agents로 에이전트 실행 피드백을 독점하려는 것처럼 보인다. 이 해석이 맞다면, 이건 장기적으로 모델 품질 우위의 원천이 될 수 있다는 생각이 든다.

Messages API vs Managed Agents: 메시지 API는 프롬프트와 응답만 Anthropic에 도달, 실행 궤적은 외부 하네스의 내부 상태. Managed Agents는 전 실행 궤적을 append-only 이벤트 로그로 직접 수집.

보완재의 가치가 줄어드는 방향

Cursor와 Cognition의 본질적 가치는 Claude를 어떻게 오케스트레이션하느냐에 있다. 즉 그들은 하네스 회사다. 이 포지셔닝은 Anthropic 입장에서 위험할 수 있다. 하네스 회사가 정교해질수록, 그들은 우리의 진짜 가치는 하네스이고 모델은 교체 가능한 백엔드라고 주장할 수 있게 되기 때문이다. Cursor가 Claude에서 다른 모델로 이탈하는 순간 Anthropic은 매출의 큰 덩어리를 잃게 된다.

Managed Agents는 이 위협을 정면에서 흐리게 만드는 장치로 읽힌다. 하네스 설계는 어려운 일이니 우리가 제공한다, 너희는 UX에 집중하면 된다. 이건 Joel Spolsky가 commoditize your complements라고 이름 붙인 고전 전략의 정확한 실행처럼 느껴졌다. 보완재의 가치가 0에 수렴하면, 경쟁 축이 다시 모델 품질과 런타임 인프라로 돌아온다. 그리고 그 두 축은 Anthropic이 잘 싸울 수 있는 링이다.

실제로 이 효과가 얼마나 클지는 나도 아직 확신이 없다. Cursor처럼 이미 자기 에코시스템을 쌓은 회사들은 쉽게 흔들리지 않을 수 있다. 다만 아직 하네스를 고민 중인 신규 플레이어들에게는 이 베팅이 분명한 진입 장벽으로 작동할 것 같다.

하네스 레이어가 Anthropic 기본값으로 흡수되는 구조 변화. Cursor/Cognition이 쌓은 하네스 가치가 commoditize되고, 경쟁 축이 모델 품질과 런타임 인프라로 회귀.

엔터프라이즈 방향의 교두보

Managed Agents의 기능 목록을 처음 봤을 때 오버엔지니어링처럼 느껴졌다. 크레덴셜 vault, VPC 접근 정책, 감사 로그, 격리된 샌드박스, 세션 복구. 이 모든 것이 개인 개발자나 인디 해커에게는 필요 없는 기능들이다. 그런데 이 목록을 다시 보면 정확히 엔터프라이즈 CISO의 도입 체크리스트라는 생각이 든다. 개인용이 아니라 기업용 제품이라는 뜻으로 읽힌다.

Anthropic의 엔터프라이즈 포지셔닝은 원래도 OpenAI보다 강했다. AWS와 Google Cloud에 동시에 올라타 있고, Fortune 500 침투율도 높다. 여기서 Managed Agents는 장기 자율 에이전트를 기업 내부 네트워크에서 안전하게 돌리고 싶다는 요구를 직접 받아내는 설계로 보인다. OpenAI가 ChatGPT로 소비자 시장을 지배하는 동안, Anthropic은 엔터프라이즈 자율 실행 인프라라는 전혀 다른 전선을 파고 있는 것 같다.

같은 AI 회사라도 두 회사는 점점 더 다른 게임을 한다는 인상을 받는다.

Managed Agents의 엔터프라이즈 체크리스트: Credential Vault, VPC 접근 정책, 감사 로그, 격리된 샌드박스, 세션 복구. CISO 도입 요구사항을 직접 충족.

에이전트라는 원시타입의 선점

현재 AI 업계의 API 원시타입은 메시지다. 입력 메시지를 넣으면 출력 메시지가 나온다. 이 추상은 지난 5년간의 LLM 사용 패턴을 지배했다. 그런데 에이전트 시대가 본격화되면 이 추상만으로는 부족하다는 생각이 든다. 누군가는 agent라는 새로운 원시타입을 정의해야 하고, 먼저 정의한 쪽의 버전이 업계 표준이 될 가능성이 크다.

Anthropic은 Managed Agents로 자기 버전의 정의를 먼저 내놓은 것으로 보인다. Agent는 버전 관리되는 설정, Environment는 샌드박스 템플릿, Session은 실행 1회분. 이 세 개념을 API 레벨에서 고정하고 있다. 경쟁사들이 각자 다른 추상을 내놓는 지금이 일종의 추상 계층 전쟁의 골든 타임처럼 느껴진다.

REST API를 먼저 표준화한 쪽이 웹의 일부를 가져갔고, pod을 primitive로 만든 Kubernetes가 컨테이너 오케스트레이션을 장악했다. 에이전트 원시타입의 정의권을 쥐는 쪽이 다음 시대의 추상 계층을 가져갈 가능성이 있다. 이 베팅의 보상은 즉각적이지 않지만 이기면 엄청나게 크기 때문에, 지금 시점에 내놓는 것이 나한테는 합리적으로 보였다.

API 원시타입의 변천: Messages API(입력→출력 메시지)에서 Agent API(Agent/Environment/Session 3개 개념)로. 원시타입을 정의하는 쪽이 다음 시대의 추상 계층을 가져간다.

수요를 키우는 쪽의 투자

마지막 베팅은 가장 장기적이고 가장 공격적으로 읽혔다. 지금 에이전트 구축의 진입 장벽은 모델 성능이 아니라 운영의 피로감에 가깝다. 하네스를 짜고, 인프라를 세팅하고, 장애를 복구하고, 크레덴셜을 관리하는 일이 전부 귀찮기 때문에 대부분의 기업은 에이전트를 파일럿 한두 개 수준에서 멈춘다.

Managed Agents는 이 활성화 에너지를 극적으로 낮추는 장치다. 경제학에 Jevons 역설이라는 개념이 있다. 기술이 효율화되면 그 자원의 수요가 줄어드는 게 아니라 오히려 폭발한다는 관찰이다. 증기기관이 석탄 효율을 개선했더니 석탄 수요가 더 늘어났던 사례다. Anthropic이 같은 논리를 에이전트에 적용하고 있는 것처럼 보인다. 에이전트 운영을 쉽게 만들면, 지금 1개 돌리던 회사가 1년 뒤에는 10개, 100개를 돌리게 된다.

이건 모델 한계를 극복하는 게 아니라, 아직 존재하지 않는 수요를 선제적으로 만드는 투자라는 생각이 든다. 수요가 폭발하는 시점에 그 인프라를 소유한 쪽이 공급자로 올라탄다는 시나리오를 그리고 있는 것 같다.

Jevons 역설 적용: 에이전트 운영 진입 장벽 → Managed Agents가 활성화 에너지 낮춤 → 에이전트 수 1→10→100 지수적 폭발. 존재하지 않는 수요를 선제적으로 창출하는 투자.

내가 읽은 시그널

여섯 가지 베팅을 묶어서 보면, Anthropic이 그리는 미래의 지형도가 어렴풋이 드러난다. 모델 API 회사에서 에이전트 런타임 회사로, 토큰 단가 경쟁에서 인프라 점유 경쟁으로, 소비자 UI에서 엔터프라이즈 자율 실행으로. 그리고 이 전환의 연료가 되는 건 다름 아닌 에이전트 실행 기록이라는 새로운 데이터 자산으로 보인다.

이 해석이 다 맞다고 확신하지는 않는다. 내가 회사 외부에서 문서와 블로그를 읽고 짐작한 그림이기 때문에, 안에서 본 사람들에게는 다르게 보일 수도 있다. 다만 이 중 몇 개는 상당히 맞는 것 같다는 직감이 있다. 특히 실행 궤적 데이터를 직접 수집하는 쪽으로 간다는 점은, 메시지 API 시대와 Managed Agents 시대를 가르는 결정적 차이라고 본다.

나한테 이 글이 남긴 가장 큰 질문은 결국 이거다. 몇 년 후 돌아봤을 때, 에이전트 시대의 클라우드 기업이 어디가 될 것인가. 지금 시점에서는 그 자리를 Anthropic이 가장 구체적인 전략으로 노리고 있는 것처럼 보인다. 다른 플레이어들이 어떻게 반응할지가 앞으로의 관전 포인트가 될 것 같다.

>>> 원문 아티클 <<<

이준용 AI Native · Product Manager

진짜 문제를 찾기 위해 가끔 목숨을 겁니다

팔로우 🙌 커피챗

댓글이 없습니다.