LLM 출력을 짧고 단편적인 영어로 압축해 출력 토큰을 65~75% 줄이는 Claude Code 플러그인. 같은 정보, 더 적은 토큰, 더 긴 세션.
claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash npx skills add JuliusBrussee/caveman -a <cursor|windsurf|cline|github-copilot> gemini extensions install https://github.com/JuliusBrussee/caveman 왜 필요한가?
LLM 코딩 어시스턴트의 응답은 대개 친절한 자연어 문장으로 길게 늘어집니다. 핵심 정보보다 연결어, 관용 표현, 반복 설명이 더 많은 출력 토큰을 차지하고, 그만큼 5시간 한도와 API 예산이 빠르게 소진됩니다.
Caveman은 출력을 의도적으로 짧고 단편적인 영어(관사·관용어 생략)로 재작성해 같은 정보를 2535%의 토큰으로 전달합니다.
주요 기능
- 3단계 강도 —
/caveman lite(군더더기 제거, 문법 유지),/caveman full(기본, 단편화·관사 생략),/caveman ultra(최대 압축, 약어 사용) /caveman wenyan— 文言文(고문) 모드, 한자 기반 추가 압축/caveman-commit— 50자 이내의 conventional commit 메시지 생성/caveman-review— 줄 번호와 함께 한 줄로 끝나는 PR 코멘트/caveman-stats— 세션·누적 토큰 사용량과 절감량 추적/caveman-compress— 메모리·문서 파일을 다시 작성해 입력 토큰 ~46% 절감cavecrew서브에이전트 — investigator·builder·reviewer 역할별 분리- Statusline 절감 배지 — 현재 세션의 절감량을 상단에 표시
caveman-shrinkMCP 미들웨어 — MCP 도구 설명을 압축해 컨텍스트 길이 단축
출력 예시
| 모드 | 응답 | 토큰 |
|---|---|---|
| Normal | ”The reason your React component is re-rendering is likely because you’re creating a new object reference on each render cycle…” | ~69 |
| Caveman | ”New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo.” | 19 |
지원 AI 클라이언트
Claude Code, Gemini CLI, Codex, Cursor, Windsurf, Cline, GitHub Copilot, Continue, Kilo, Roo, Augment, Aider, Amp, Goose, JetBrains Junie, Kiro CLI, OpenHands, opencode, Tabnine, Trae, Warp, Replit Agent, Antigravity 등 40개 이상.
Before / After
Before: 답변 하나에 60~90개 이상의 출력 토큰 소비 → 5시간 한도와 API 예산 빠르게 소진
After: /caveman 한 줄로 활성화 → 같은 정보를 19~30개 토큰으로 전달, 동일 한도에서 더 긴 세션 유지
활성화 방법
설치 후 다음 중 하나로 활성화:
- 슬래시 명령:
/caveman,/caveman lite|full|ultra,/caveman wenyan - 자연어: “talk like caveman”, “less tokens please”
해제는 “stop caveman” 또는 “normal mode”라고 입력합니다.
자주 묻는 질문
Caveman은 무엇인가요?
LLM 출력을 짧고 단편적인 영어(관사·연결어·관용 표현 생략)로 압축해 출력 토큰을 65~75% 줄이는 Claude Code 플러그인입니다. 정보는 보존하면서 토큰만 줄이는 것이 목표입니다.
어떤 AI 도구에서 동작하나요?
Claude Code, Gemini CLI, Codex, Cursor, Windsurf, Cline, GitHub Copilot, Continue, OpenHands, JetBrains Junie 등 40개 이상의 에이전트를 지원합니다.
어떻게 설치하나요?
Claude Code는 `claude plugin marketplace add JuliusBrussee/caveman && claude plugin install caveman@caveman`으로 설치합니다. 다른 에이전트까지 한 번에 자동 감지하려면 `curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash`를 실행합니다.
어떻게 활성화·해제하나요?
활성화는 `/caveman` 또는 강도 옵션(`/caveman lite|full|ultra`)을 호출하거나 자연어 "talk like caveman"·"less tokens please"로 가능합니다. 해제는 "stop caveman" 또는 "normal mode"라고 입력합니다.
어떤 추가 명령을 제공하나요?
`/caveman-commit`(50자 이내 conventional commit), `/caveman-review`(줄 번호 포함 한 줄 PR 코멘트), `/caveman-stats`(세션·누적 절감량), `/caveman-compress`(메모리/문서 파일 재작성, 입력 토큰 ~46% 절감)를 제공합니다.
무료인가요?
MIT 라이선스 오픈소스로 무료로 사용할 수 있습니다.