Managed Agents는 무엇인가요?

Anthropic이 관리하는 에이전트 하니스(harness)와 인프라를 제공하는 베타 API입니다. 자체 에이전트 루프·도구 실행 환경·샌드박스를 구축하지 않고도 Claude가 파일 읽기/쓰기, 쉘 명령, 웹 검색, 코드 실행을 자율적으로 수행하는 환경을 바로 사용할 수 있습니다.

Messages API와 무엇이 다른가요?

Messages API는 직접 모델 프롬프팅과 세밀한 제어에 적합하고, Managed Agents는 장시간 실행되는 비동기 작업과 관리형 인프라가 필요한 경우에 적합합니다. Managed Agents는 인프라를 Anthropic이 관리합니다.

어떻게 과금되나요?

토큰 비용 + 세션 런타임 비용 두 가지가 청구됩니다. 토큰은 Messages API와 동일한 단가, 세션 런타임은 `running` 상태에서 시간당 $0.08(밀리초 단위 측정). `idle`·`rescheduling`·`terminated` 상태는 과금되지 않습니다. 세션 내 웹 검색은 1,000회당 $10 추가.

지원되지 않는 옵션이 있나요?

Managed Agents에는 Batch API 할인, Fast mode 프리미엄, Data residency 옵션이 적용되지 않으며, AWS Bedrock·Vertex AI 같은 서드파티 플랫폼은 미지원입니다(Claude API 직접 연결만 지원).

사용 시 필요한 설정은 무엇인가요?

현재 베타 단계로 모든 엔드포인트에 `managed-agents-2026-04-01` 베타 헤더가 필요합니다(SDK 사용 시 자동 설정). 모든 API 계정에서 기본 활성화되어 있고, outcomes·multiagent·memory 기능은 리서치 프리뷰로 별도 신청이 필요합니다.

공식 문서는 어디서 볼 수 있나요?

공식 문서: platform.claude.com/docs/en/managed-agents/overview

Claude Managed Agents 출시

핵심 요약

Anthropic이 Claude Managed Agents를 베타로 출시했습니다. 기존 Messages API와는 별도로, 사전 구축된 에이전트 하니스(harness)와 관리형 인프라를 제공합니다.

직접 에이전트 루프, 도구 실행 환경, 샌드박스를 구축할 필요 없이, Claude가 파일 읽기/쓰기, 쉘 명령 실행, 웹 검색, 코드 실행을 자율적으로 수행하는 환경을 바로 사용할 수 있습니다.

Messages API와의 차이

	Messages API	Managed Agents
성격	직접 모델 프롬프팅	관리형 에이전트 하니스
적합한 용도	커스텀 에이전트 루프, 세밀한 제어	장시간 실행, 비동기 작업
인프라	직접 구축	Anthropic이 관리

핵심 개념 (4가지)

Agent — 모델, 시스템 프롬프트, 도구, MCP 서버, 스킬을 정의한 설정
Environment — 패키지, 네트워크 접근, 마운트 파일이 설정된 클라우드 컨테이너 템플릿
Session — 에이전트+환경 위에서 실행되는 인스턴스. 특정 작업을 수행하고 결과를 생성
Events — 앱과 에이전트 간 주고받는 메시지 (사용자 입력, 도구 결과, 상태 업데이트)

작동 방식

Agent 생성 — 모델, 시스템 프롬프트, 도구를 정의. 한 번 만들면 ID로 재사용
Environment 생성 — Python, Node.js 등 패키지가 설치된 컨테이너 설정
Session 시작 — Agent + Environment를 참조하여 세션 실행
이벤트 송수신 — 사용자 메시지를 보내면 Claude가 자율적으로 도구를 실행하고 SSE로 결과를 스트리밍
중간 개입 — 실행 중에도 추가 이벤트를 보내 에이전트 방향을 조정하거나 중단 가능

내장 도구

Bash — 컨테이너 내 쉘 명령 실행
파일 작업 — 읽기, 쓰기, 편집, glob, grep
웹 검색/가져오기 — 웹 검색 및 URL 콘텐츠 가져오기
MCP 서버 — 외부 도구 제공자 연결

어떤 경우에 적합한가?

장시간 실행 — 수분~수시간에 걸친 다단계 도구 호출 작업
클라우드 인프라 필요 — 패키지가 설치된 보안 컨테이너 환경
인프라 최소화 — 에이전트 루프, 샌드박스, 도구 실행 레이어를 직접 만들고 싶지 않을 때
상태 유지 세션 — 파일 시스템과 대화 이력이 여러 상호작용에 걸쳐 유지

시작하기

Managed Agents는 모든 Anthropic API 계정에서 기본 활성화되어 있어 별도 신청 없이 곧바로 사용할 수 있습니다(Dreaming 등 일부 리서치 프리뷰 기능만 별도 신청).

사전 요구 사항

Anthropic Console 계정과 API 키
SDK(Python·TypeScript·Java·Go·C#·Ruby·PHP) 또는 직접 호출용 HTTP 클라이언트
모든 엔드포인트에 anthropic-beta: managed-agents-2026-04-01 헤더(SDK 사용 시 자동 설정)

SDK 설치와 API 키 설정

# Python
pip install anthropic

# TypeScript
npm install @anthropic-ai/sdk

# 공통: API 키 환경변수
export ANTHROPIC_API_KEY="..."

4단계 호출 흐름

Agent 생성 — 모델·시스템 프롬프트·도구셋(agent_toolset_20260401)을 정의해 ID 발급. 한 번 만들면 여러 세션에서 재사용
Environment 생성 — 컨테이너 설정(네트워킹, 사전 설치 패키지, 마운트 파일) 정의해 ID 발급
Session 생성 — Agent ID + Environment ID로 세션 시작
이벤트 송수신 — user.message 이벤트로 메시지를 보내면 Claude가 자율적으로 도구를 실행하고 SSE 스트림으로 결과를 돌려줍니다. 실행 중간에 추가 이벤트를 보내 방향을 조정하거나 중단할 수도 있습니다

Python 최소 예시:

from anthropic import Anthropic

client = Anthropic()

agent = client.beta.agents.create(
    name="Coding Assistant",
    model="claude-opus-4-7",
    system="You are a helpful coding assistant.",
    tools=[{"type": "agent_toolset_20260401"}],
)

environment = client.beta.environments.create(
    name="quickstart-env",
    config={"type": "cloud", "networking": {"type": "unrestricted"}},
)

session = client.beta.sessions.create(
    agent=agent.id,
    environment_id=environment.id,
    title="Quickstart",
)

세션에 메시지를 보내고 SSE 스트림을 처리하는 전체 예시(7개 언어 SDK·CLI·curl)는 공식 Quickstart 문서에 정리되어 있습니다.

인터랙티브 온보딩

최신 Claude Code에서 /claude-api managed-agents-onboard 명령을 실행하면 단계별 안내와 질의응답으로 셋업을 진행할 수 있습니다(Anthropic 공식 문서에서 안내).

레이트 리밋

조직 단위로 적용되며, 그 위에 API 티어별 한도가 함께 적용됩니다.

엔드포인트 종류	제한
생성(agents·sessions·environments 등)	분당 300회
조회·스트림(retrieve·list·stream 등)	분당 600회

과금 구조

Managed Agents는 토큰 비용 + 세션 런타임 비용 두 가지로 청구됩니다. 단순히 API 토큰 비용만 나가는 것이 아닙니다.

토큰 비용

일반 Messages API와 동일한 모델별 토큰 단가 적용
프롬프트 캐싱 할인도 동일하게 적용
세션 내 웹 검색은 1,000회당 $10 추가 과금

세션 런타임 비용

항목	요금	측정 기준
세션 런타임	시간당 $0.08	`running` 상태 지속 시간

밀리초 단위로 정밀 측정
running 상태일 때만 과금 — idle(대기), rescheduling, terminated 상태는 과금되지 않음
Code Execution의 컨테이너 시간 과금을 대체 (중복 과금 없음)

비용 예시

Claude Opus 4.6으로 1시간 코딩 세션 (입력 50K 토큰, 출력 15K 토큰):

항목	계산	비용
입력 토큰	50,000 × $5/MTok	$0.25
출력 토큰	15,000 × $25/MTok	$0.375
세션 런타임	1시간 × $0.08	$0.08
합계		$0.705

Messages API와 다른 점

다음 할인/옵션은 Managed Agents에 적용되지 않습니다:

Batch API 할인 (세션은 상태를 유지하는 대화형이므로)
Fast mode 프리미엄 (런타임이 추론 속도를 관리)
Data residency 옵션
서드파티 플랫폼 (AWS Bedrock, Vertex AI 등) — Claude API 직접 연결만 지원

알아두면 좋은 점

현재 베타 단계 — 모든 엔드포인트에 managed-agents-2026-04-01 베타 헤더 필요
SDK 사용 시 베타 헤더가 자동 설정됨
모든 API 계정에서 기본 활성화
outcomes, multiagent, memory 기능은 리서치 프리뷰로 별도 신청 필요