💡

LLM 출력을 짧고 단편적인 영어로 압축해 출력 토큰을 65~75% 줄이는 Claude Code 플러그인. 같은 정보, 더 적은 토큰, 더 긴 세션.

출력 토큰 65~75% 절감 경험 개선
설치 방법 · plugin marketplace (JuliusBrussee/caveman)
Claude Code $ claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman
Universal one-liner (40+ 에이전트 자동 감지) $ curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash
Cursor / Windsurf / Cline / Copilot $ npx skills add JuliusBrussee/caveman -a <cursor|windsurf|cline|github-copilot>
Gemini CLI $ gemini extensions install https://github.com/JuliusBrussee/caveman

왜 필요한가?

LLM 코딩 어시스턴트의 응답은 대개 친절한 자연어 문장으로 길게 늘어집니다. 핵심 정보보다 연결어, 관용 표현, 반복 설명이 더 많은 출력 토큰을 차지하고, 그만큼 5시간 한도와 API 예산이 빠르게 소진됩니다.

Caveman은 출력을 의도적으로 짧고 단편적인 영어(관사·관용어 생략)로 재작성해 같은 정보를 2535%의 토큰으로 전달합니다.

주요 기능

  • 3단계 강도/caveman lite(군더더기 제거, 문법 유지), /caveman full(기본, 단편화·관사 생략), /caveman ultra(최대 압축, 약어 사용)
  • /caveman wenyan — 文言文(고문) 모드, 한자 기반 추가 압축
  • /caveman-commit — 50자 이내의 conventional commit 메시지 생성
  • /caveman-review — 줄 번호와 함께 한 줄로 끝나는 PR 코멘트
  • /caveman-stats — 세션·누적 토큰 사용량과 절감량 추적
  • /caveman-compress — 메모리·문서 파일을 다시 작성해 입력 토큰 ~46% 절감
  • cavecrew 서브에이전트 — investigator·builder·reviewer 역할별 분리
  • Statusline 절감 배지 — 현재 세션의 절감량을 상단에 표시
  • caveman-shrink MCP 미들웨어 — MCP 도구 설명을 압축해 컨텍스트 길이 단축

출력 예시

모드응답토큰
Normal”The reason your React component is re-rendering is likely because you’re creating a new object reference on each render cycle…”~69
Caveman”New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo.”19

지원 AI 클라이언트

Claude Code, Gemini CLI, Codex, Cursor, Windsurf, Cline, GitHub Copilot, Continue, Kilo, Roo, Augment, Aider, Amp, Goose, JetBrains Junie, Kiro CLI, OpenHands, opencode, Tabnine, Trae, Warp, Replit Agent, Antigravity 등 40개 이상.

Before / After

Before: 답변 하나에 60~90개 이상의 출력 토큰 소비 → 5시간 한도와 API 예산 빠르게 소진

After: /caveman 한 줄로 활성화 → 같은 정보를 19~30개 토큰으로 전달, 동일 한도에서 더 긴 세션 유지

활성화 방법

설치 후 다음 중 하나로 활성화:

  • 슬래시 명령: /caveman, /caveman lite|full|ultra, /caveman wenyan
  • 자연어: “talk like caveman”, “less tokens please”

해제는 “stop caveman” 또는 “normal mode”라고 입력합니다.

자주 묻는 질문

Caveman은 무엇인가요?

LLM 출력을 짧고 단편적인 영어(관사·연결어·관용 표현 생략)로 압축해 출력 토큰을 65~75% 줄이는 Claude Code 플러그인입니다. 정보는 보존하면서 토큰만 줄이는 것이 목표입니다.

어떤 AI 도구에서 동작하나요?

Claude Code, Gemini CLI, Codex, Cursor, Windsurf, Cline, GitHub Copilot, Continue, OpenHands, JetBrains Junie 등 40개 이상의 에이전트를 지원합니다.

어떻게 설치하나요?

Claude Code는 `claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman`으로 설치합니다. 다른 에이전트까지 한 번에 자동 감지하려면 `curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash`를 실행합니다.

어떻게 활성화·해제하나요?

활성화는 `/caveman` 또는 강도 옵션(`/caveman lite|full|ultra`)을 호출하거나 자연어 "talk like caveman"·"less tokens please"로 가능합니다. 해제는 "stop caveman" 또는 "normal mode"라고 입력합니다.

어떤 추가 명령을 제공하나요?

`/caveman-commit`(50자 이내 conventional commit), `/caveman-review`(줄 번호 포함 한 줄 PR 코멘트), `/caveman-stats`(세션·누적 절감량), `/caveman-compress`(메모리/문서 파일 재작성, 입력 토큰 ~46% 절감)를 제공합니다.

무료인가요?

MIT 라이선스 오픈소스로 무료로 사용할 수 있습니다.