핵심 요약
Anthropic이 Claude Opus 4.8을 2026년 5월 28일에 출시했습니다. Opus 4.7을 기반으로 코딩, 에이전트 작업, 전문 업무 전반에서 벤치마크 성능을 끌어올렸고, 장시간 실행되는 작업에서 더 일관되게 동작합니다. 일반 사용 가격은 Opus 4.7과 동일($5/$25 per MTok)하며, 모델 ID는 claude-opus-4-8입니다.
주요 개선
-
장기 에이전트 코딩
이전 Opus는 긴 코딩 세션에서 컨텍스트가 길어지면 작업이 흐트러지거나 압축(compaction) 이후 흐름을 놓치는 경우가 있었습니다. Opus 4.8은 긴 컨텍스트 처리가 개선되고 압축 횟수가 줄었으며, 압축 이후 작업 복구도 더 안정적입니다. 또한 자신이 작성한 코드의 결함을 그냥 지나칠 가능성이 이전 모델보다 약 4배 낮아졌습니다.
-
노력(effort) 레벨 보정
같은 effort 레벨이라도 도메인에 따라 동작이 들쑥날쑥할 수 있었습니다. Opus 4.8은 각 레벨에서 더 일관된 추론 동작을 보이도록 보정됐습니다. 기본 effort는 Claude API와 Claude Code를 포함한 모든 환경에서
high이며, 직접 지정한 값은 그대로 유지됩니다. -
도구 호출 정확도
Opus 4.7에서는 작업에 필요한 도구 호출을 건너뛰는 사례가 일부 보고됐습니다. Opus 4.8은 필요한 도구를 빠뜨리는 경우가 줄었고, 더 적은 단계로 효율적으로 도구를 호출합니다.
-
적응형 사고(adaptive thinking)
Opus 4.8은 적응형 사고를 켜면 턴마다 추론이 필요한지 스스로 판단합니다. 단순 조회나 짧은 단계에서는 곧바로 답하고, 복잡한 다단계 문제에서만 먼저 추론합니다. 덕분에 같은 effort 레벨에서 Opus 4.7보다 낭비되는 thinking 토큰이 줄어듭니다.
신규 기능
-
대화 중간 system 메시지
긴 대화에서 지시를 갱신하려면 전체 시스템 프롬프트를 다시 보내야 했습니다. Opus 4.8은 사용자 턴 직후
messages배열에role: "system"메시지를 넣을 수 있어, 앞선 턴의 프롬프트 캐시를 유지한 채 지시만 덧붙일 수 있습니다. 별도 베타 헤더가 필요 없습니다. -
Fast mode (Claude API research preview)
Opus 4.8은 Claude API에서
speed: "fast"로 동일 모델의 출력 토큰 처리 속도를 최대 2.5배 높이는 Fast mode를 research preview로 제공합니다. 프리미엄 가격이 적용됩니다. -
거부 응답의 stop_details
Claude이 요청을 거부할 때 반환하는
stop_details객체가 공식 문서화됐습니다. 기존refusal정지 사유에 더해 거부 유형(category)을 알려줘, 애플리케이션이 거부 종류를 구분해 다음 단계를 안내하기 쉬워집니다. -
프롬프트 캐시 최소 길이 인하
Opus 4.8의 캐시 가능 최소 프롬프트 길이가 1,024토큰으로, Opus 4.7보다 낮아졌습니다. 4.7에서 너무 짧아 캐시되지 않던 프롬프트도 코드 변경 없이 캐시 항목을 만들 수 있습니다.
벤치마크 성능
| 영역 | 결과 |
|---|---|
| Super-Agent | 모든 케이스를 end-to-end로 완료한 유일한 모델, 동일 비용에서 이전 Opus와 GPT-5.5 능가 |
| CursorBench | 모든 effort 레벨에서 이전 Opus 능가 |
| Legal Agent Benchmark | 기록된 최고 점수, all-pass 기준 전체 10% 최초 돌파 |
| Online-Mind2Web | 84% (Opus 4.7, GPT-5.5 대비 의미 있는 향상) |
가격 및 사용처
| 항목 | 내용 |
|---|---|
| 입력 / 출력 (일반) | $5 / $25 per MTok (Opus 4.7과 동일) |
| 모델 ID | claude-opus-4-8 |
| 컨텍스트 | Claude API, Amazon Bedrock, Vertex AI에서 1M 토큰 기본 (Microsoft Foundry는 200k) |
| 최대 출력 | 128k 토큰 |
| 플랜 | Pro, Max, Team, Enterprise |
| 플랫폼 | Claude.ai, Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
알아두면 좋은 점
- 샘플링 파라미터 제한 유지 — Opus 4.7과 동일하게
temperature,top_p,top_k를 기본값 외로 설정하면 400 오류가 납니다. 프롬프트로 동작을 조정하세요. - 사고 모드는 adaptive만 지원 — 확장 사고 예산(
thinking: {type: "enabled", budget_tokens: N})은 지원하지 않습니다(400 오류).adaptive thinking과 effort로 추론 깊이를 조절합니다. - API 변경 없음 — 위 제약은 모두 Opus 4.7과 같아, 4.7에서 동작하던 코드는 수정 없이 그대로 실행됩니다. 다만 동작 변화(낭비되는 thinking 감소, 도구 호출 개선 등)에 맞춰 프롬프트를 손볼 수 있습니다.
- 마이그레이션 가이드 — Opus 4.7에서 옮겨갈 때는 공식 마이그레이션 가이드를 참고하세요. Claude Code, Agent SDK 사용자는 Claude API skill로 마이그레이션 단계를 자동 적용할 수 있습니다.