Claude Managed Agents — Dreaming·Outcomes·Multiagent·Webhooks 추가

💡

4월 8일 베타로 출시된 Managed Agents가 한 달 만에 큰 폭으로 확장되었습니다. 세션 사이에 메모리를 정리·구조화해 자기 개선을 유도하는 Dreaming(리서치 프리뷰), 별도 grader가 결과물을 채점하는 Outcomes·여러 전문 서브에이전트가 병렬 협업하는 Multiagent Orchestration·Memory가 모두 Public Beta로 승격되었고, 비동기 작업 완료 알림용 Webhooks가 새로 합류했습니다.

🔗 공식 발표 →

이 글은 공식 문서를 바탕으로 요약·정리한 내용입니다.

핵심 요약

2026년 4월 8일 베타로 출시된 Claude Managed Agents가 한 달 만에 큰 폭으로 확장되었습니다. 5월 6일 발표에서 두 개의 신규 기능(Dreaming, Webhooks)이 합류하고, 기존 outcomes·multiagent·memory가 모두 Public Beta로 승격되었습니다. 출시 시점이 “관리형 에이전트 인프라 제공”에 가까웠다면, 이번 업데이트는 “에이전트가 스스로 학습하고 협업하는 도구셋”으로의 확장입니다.

주요 기능

  • Dreaming (리서치 프리뷰)

    에이전트가 작업 중 캡처한 메모리는 시간이 지나면 노이즈가 쌓여 신호 품질이 떨어집니다. Dreaming은 정기적으로 과거 세션과 메모리 저장소를 검토해 반복되는 실수, 워크플로 수렴, 팀 선호도 같은 패턴을 추출하고 메모리를 재구조화합니다. 에이전트가 자동으로 메모리를 갱신하거나, 변경 적용 전에 사람이 검토하도록 설정할 수 있습니다. Harvey의 에이전트 사례에서 완료율이 약 6배 향상되었다고 발표되었으며, 장시간 실행 작업과 멀티 에이전트 환경에서 특히 효과가 크다고 명시되어 있습니다. 발표 시점 기준 별도 신청 폼을 통한 접근입니다.

  • Outcomes (Public Beta로 승격)

    기존 프롬프팅 루프는 에이전트가 자기 결과물을 자기 컨텍스트 안에서 평가하므로 자체 검열이 약했습니다. Outcomes에서는 개발자가 성공 기준을 루브릭으로 정의하면 별도 grader가 자기 컨텍스트 창 안에서 결과물을 채점하고, 필요한 수정 사항을 식별해 에이전트가 스스로 교정합니다. Anthropic 자체 테스트에서 표준 프롬프팅 루프 대비 작업 성공률이 최대 10포인트 향상, docx 생성에서 +8.4%, pptx 생성에서 +10.1% 개선이 측정되었습니다.

  • Multiagent Orchestration (Public Beta로 승격)

    단일 에이전트로 처리하기에는 컨텍스트가 길거나 도메인이 분산된 작업이 많아졌습니다. Multiagent Orchestration은 리드 에이전트가 작업을 분해해 각 서브에이전트(자체 모델·프롬프트·도구를 가진 전문가)에게 병렬로 위임하는 구조를 제공합니다. 서브에이전트들은 공유 파일시스템 위에서 협업하며 영속 이벤트 히스토리를 유지하고, 전체 실행 흐름은 Claude Console에서 단계별로 추적됩니다. Netflix는 수백 개 빌드의 로그 분석에, Spiral은 리드 에이전트에 Haiku·서브에이전트에 Opus를 두는 구성으로 사용 중입니다.

  • Webhooks (Public Beta)

    장시간 실행되는 에이전트 작업의 완료 시점을 클라이언트가 폴링으로 잡아내야 했습니다. Webhooks는 “outcome을 정의하고 에이전트를 띄운 뒤, 끝나면 webhook 알림을 받는” 비동기 워크플로를 공식 패턴으로 추가합니다.

  • Memory (Public Beta로 승격)

    4월 출시 시점에 리서치 프리뷰였던 Memory가 Public Beta로 승격되었습니다. 에이전트가 작업 중 학습한 내용을 캡처해 두면, Dreaming이 세션 사이에 그 학습을 정제·재구조화해 여러 에이전트에 걸친 패턴을 추출합니다. Memory와 Dreaming이 한 쌍으로 동작하는 구조입니다.

알아두면 좋은 점

  • outcomes·multiagent·memory가 기본 활성화로 변경 — 출시 시점에는 세 기능 모두 별도 신청이 필요했지만, 이번 업데이트로 Public Beta가 되어 모든 Managed Agents 계정에서 곧바로 사용할 수 있습니다.
  • Dreaming만 신청 단계 — 다섯 기능 중 Dreaming만 리서치 프리뷰로 남아 신청 폼을 통한 접근입니다. 메모리 신호 품질 유지가 운영에 미치는 영향이 큰 만큼, 사용 전 자기 워크플로에서의 효과를 한 번 검증한 뒤 도입하는 것이 권장됩니다.
  • Outcomes의 grader는 별도 컨텍스트에서 동작 — 에이전트의 추론에 영향받지 않고 독립적으로 채점합니다. 평가 기준을 루브릭 형태로 명시할수록 효과가 큽니다.
  • Multiagent 비용 분해 — 모델 단가 차이 활용 — Spiral 사례처럼 리드 에이전트는 빠른 모델, 깊은 작업이 필요한 서브에이전트는 강력한 모델로 모델을 섞으면 비용·품질 트레이드오프를 조정할 수 있습니다.
  • 모든 신규 기능은 Managed Agents API 위에서 동작 — Managed Agents 자체는 여전히 베타이며 managed-agents-2026-04-01 베타 헤더가 필요합니다(SDK 사용 시 자동).

자주 묻는 질문

이번 발표의 핵심은 무엇인가요?

Managed Agents에 신규 기능 두 개(Dreaming, Webhooks)가 추가되고, 기존 Outcomes·Multiagent Orchestration·Memory가 모두 Public Beta로 승격되었습니다. 출시 한 달 만에 "인프라 제공"에서 "에이전트 자기 개선·협업"까지 확장된 라인업입니다.

Dreaming은 무엇이고 어떤 단계인가요?

리서치 프리뷰 단계의 기능으로, 과거 세션과 메모리 저장소를 정기적으로 검토해 패턴을 추출하고 메모리를 큐레이션합니다. 에이전트 자기 개선을 노리는 장치이며, 헤지펀드·법률 자동화 사례에서 완료율이 약 6배 향상되었다고 발표되었습니다. 별도 신청이 필요합니다.

Outcomes는 어떻게 동작하나요?

개발자가 성공 기준을 루브릭으로 정의하면 별도 grader가 자기 컨텍스트에서 결과물을 채점합니다. 에이전트 추론에 영향받지 않고 독립 평가를 내립니다. 표준 프롬프팅 루프 대비 작업 성공률이 최대 10포인트, docx 생성에서 +8.4%, pptx 생성에서 +10.1% 개선이 보고되었습니다.

Multiagent Orchestration은 어떤 용도인가요?

리드 에이전트가 작업을 쪼개 각각을 전문 서브에이전트(고유한 모델·프롬프트·도구 보유)에게 병렬로 위임합니다. 서브에이전트들은 공유 파일시스템 위에서 협업하고 모든 단계가 Claude Console에서 추적됩니다. Netflix는 수백 개 빌드 로그 처리에, Spiral은 리드는 Haiku·서브는 Opus 조합으로 사용 중입니다.

Webhooks는 어떤 문제를 해결하나요?

장시간 실행되는 비동기 작업에서 완료 시점을 폴링 없이 알림으로 받을 수 있게 합니다. "outcome을 정의하고 에이전트를 띄운 뒤, 끝나면 webhook으로 알림 받는" 패턴이 공식 워크플로로 추가되었습니다. Public Beta.

기존 Managed Agents 사용자는 어떻게 영향받나요?

출시 시점에 별도 신청이 필요했던 outcomes·multiagent·memory 세 기능이 모두 Public Beta로 승격되어 기본 활성화되었습니다. Dreaming만 별도 신청 폼을 통해 접근합니다.