Claude Opus 4.8의 핵심 변화는 무엇인가요?

Opus 4.7을 기반으로 코딩, 에이전트 작업, 전문 업무 전반의 벤치마크 성능이 향상됐고, 장시간 실행되는 작업에서 더 일관되게 동작합니다. 모델 ID는 `claude-opus-4-8`이며 일반 사용 가격은 Opus 4.7과 동일($5/$25 per MTok)합니다.

언제부터, 어디서 사용할 수 있나요?

2026년 5월 28일 출시됐으며 Pro, Max, Team, Enterprise 플랜과 Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 사용할 수 있습니다.

기존 Opus 4.7 코드에 영향이 있나요?

샘플링 파라미터 제한과 adaptive thinking 전용 등 API 제약이 Opus 4.7과 같아 기존 코드는 수정 없이 동작합니다. 다만 같은 effort 레벨에서 thinking 토큰이 줄고 도구 호출이 개선되는 등 동작 변화가 있어 프롬프트를 손볼 수 있습니다.

어떤 성능 향상이 보고됐나요?

Super-Agent 벤치마크에서 모든 케이스를 end-to-end로 완료한 유일한 모델이고, Legal Agent Benchmark 최고 점수와 Online-Mind2Web 84%를 기록했습니다. 자신이 작성한 코드의 결함을 그냥 지나칠 가능성도 이전 모델보다 약 4배 낮아졌습니다.

Fast mode는 무엇인가요?

Claude API에서 `speed: "fast"`로 동일 모델의 출력 토큰 처리 속도를 최대 2.5배 높이는 기능으로, 프리미엄 가격이 적용되는 research preview입니다.

공식 발표 자료는 어디서 볼 수 있나요?

공식 발표는 anthropic.com/news/claude-opus-4-8, 기술 문서는 platform.claude.com의 "What's new in Claude Opus 4.8"에서 볼 수 있습니다.

Claude Opus 4.8 출시

핵심 요약

Anthropic이 Claude Opus 4.8을 2026년 5월 28일에 출시했습니다. Opus 4.7을 기반으로 코딩, 에이전트 작업, 전문 업무 전반에서 벤치마크 성능을 끌어올렸고, 장시간 실행되는 작업에서 더 일관되게 동작합니다. 일반 사용 가격은 Opus 4.7과 동일($5/$25 per MTok)하며, 모델 ID는 claude-opus-4-8입니다.

주요 개선

장기 에이전트 코딩

이전 Opus는 긴 코딩 세션에서 컨텍스트가 길어지면 작업이 흐트러지거나 압축(compaction) 이후 흐름을 놓치는 경우가 있었습니다. Opus 4.8은 긴 컨텍스트 처리가 개선되고 압축 횟수가 줄었으며, 압축 이후 작업 복구도 더 안정적입니다. 또한 자신이 작성한 코드의 결함을 그냥 지나칠 가능성이 이전 모델보다 약 4배 낮아졌습니다.
노력(effort) 레벨 보정

같은 effort 레벨이라도 도메인에 따라 동작이 들쑥날쑥할 수 있었습니다. Opus 4.8은 각 레벨에서 더 일관된 추론 동작을 보이도록 보정됐습니다. 기본 effort는 Claude API와 Claude Code를 포함한 모든 환경에서 high이며, 직접 지정한 값은 그대로 유지됩니다.
도구 호출 정확도

Opus 4.7에서는 작업에 필요한 도구 호출을 건너뛰는 사례가 일부 보고됐습니다. Opus 4.8은 필요한 도구를 빠뜨리는 경우가 줄었고, 더 적은 단계로 효율적으로 도구를 호출합니다.
적응형 사고(adaptive thinking)

Opus 4.8은 적응형 사고를 켜면 턴마다 추론이 필요한지 스스로 판단합니다. 단순 조회나 짧은 단계에서는 곧바로 답하고, 복잡한 다단계 문제에서만 먼저 추론합니다. 덕분에 같은 effort 레벨에서 Opus 4.7보다 낭비되는 thinking 토큰이 줄어듭니다.

신규 기능

대화 중간 system 메시지

긴 대화에서 지시를 갱신하려면 전체 시스템 프롬프트를 다시 보내야 했습니다. Opus 4.8은 사용자 턴 직후 messages 배열에 role: "system" 메시지를 넣을 수 있어, 앞선 턴의 프롬프트 캐시를 유지한 채 지시만 덧붙일 수 있습니다. 별도 베타 헤더가 필요 없습니다.
Fast mode (Claude API research preview)

Opus 4.8은 Claude API에서 speed: "fast"로 동일 모델의 출력 토큰 처리 속도를 최대 2.5배 높이는 Fast mode를 research preview로 제공합니다. 프리미엄 가격이 적용됩니다.
거부 응답의 stop_details

Claude이 요청을 거부할 때 반환하는 stop_details 객체가 공식 문서화됐습니다. 기존 refusal 정지 사유에 더해 거부 유형(category)을 알려줘, 애플리케이션이 거부 종류를 구분해 다음 단계를 안내하기 쉬워집니다.
프롬프트 캐시 최소 길이 인하

Opus 4.8의 캐시 가능 최소 프롬프트 길이가 1,024토큰으로, Opus 4.7보다 낮아졌습니다. 4.7에서 너무 짧아 캐시되지 않던 프롬프트도 코드 변경 없이 캐시 항목을 만들 수 있습니다.

벤치마크 성능

영역	결과
Super-Agent	모든 케이스를 end-to-end로 완료한 유일한 모델, 동일 비용에서 이전 Opus와 GPT-5.5 능가
CursorBench	모든 effort 레벨에서 이전 Opus 능가
Legal Agent Benchmark	기록된 최고 점수, all-pass 기준 전체 10% 최초 돌파
Online-Mind2Web	84% (Opus 4.7, GPT-5.5 대비 의미 있는 향상)

가격 및 사용처

항목	내용
입력 / 출력 (일반)	$5 / $25 per MTok (Opus 4.7과 동일)
모델 ID	`claude-opus-4-8`
컨텍스트	Claude API, Amazon Bedrock, Vertex AI에서 1M 토큰 기본 (Microsoft Foundry는 200k)
최대 출력	128k 토큰
플랜	Pro, Max, Team, Enterprise
플랫폼	Claude.ai, Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry

알아두면 좋은 점

샘플링 파라미터 제한 유지 — Opus 4.7과 동일하게 temperature, top_p, top_k를 기본값 외로 설정하면 400 오류가 납니다. 프롬프트로 동작을 조정하세요.
사고 모드는 adaptive만 지원 — 확장 사고 예산(thinking: {type: "enabled", budget_tokens: N})은 지원하지 않습니다(400 오류). adaptive thinking과 effort로 추론 깊이를 조절합니다.
API 변경 없음 — 위 제약은 모두 Opus 4.7과 같아, 4.7에서 동작하던 코드는 수정 없이 그대로 실행됩니다. 다만 동작 변화(낭비되는 thinking 감소, 도구 호출 개선 등)에 맞춰 프롬프트를 손볼 수 있습니다.
마이그레이션 가이드 — Opus 4.7에서 옮겨갈 때는 공식 마이그레이션 가이드를 참고하세요. Claude Code, Agent SDK 사용자는 Claude API skill로 마이그레이션 단계를 자동 적용할 수 있습니다.