一文分享Claude Code中省Token的小妙招

  发布时间:2026-05-09 15:43:46   作者:蝎子莱莱爱打怪   我要评论
文章介绍了两个用于减少Claude回复Token的工具,RTK和Caveman,RTK通过压缩Bash命令输出减少Token,适用于命令输出较长的场景,Caveman则通过简化Claude回复来减少Token,适用于回复内容较长的场景,两工具可配合使用

Claude Code 省 Token,可以先从两个工具入手:

RTK:压缩命令输出,减少 Bash 工具调用带来的输入 Token。

Caveman:压缩 Claude 的回复,减少输出 Token。

它们解决的问题不一样。

工具省哪部分 Token典型场景
RTK命令输出git diff、测试日志、构建日志、搜索结果
CavemanClaude 回复代码分析、review、commit、短任务回答

简单理解:

  • RTK:让 Claude 少看长日志。
  • Caveman:让 Claude 少说废话。

一、RTK:压缩命令输出

RTK 是一个 CLI proxy。它会在命令输出进入 LLM 上下文前做过滤和压缩。

README 里给出的定位是:单个 Rust 二进制、零依赖,支持 100+ 常见开发命令,目标是把常见命令输出减少 60%-90%。

它主要处理这些内容:

  • 目录列表
  • 文件读取
  • 搜索结果
  • Git 状态和 diff
  • 测试输出
  • 构建和 lint 输出
  • Docker / Kubernetes / AWS 等 CLI 输出

1. 安装 RTK

macOS 推荐用 Homebrew:

brew install rtk

Linux / macOS 可以用安装脚本:

curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh

也可以用 Cargo 从 GitHub 安装:

cargo install --git https://github.com/rtk-ai/rtk

安装后验证:

rtk --version
rtk gain

2. 接入 Claude Code

给 Claude Code 安装 hook:

rtk init --g

然后重启 Claude Code。

重启后,Claude Code 里通过 Bash 工具执行的命令会被 RTK hook 透明改写。

例如 Claude 触发:

git status

RTK 可能会改写为:

rtk git status

Claude 本身不需要知道这个改写过程。它只会看到压缩后的输出。

3. RTK 的工作方式

RTK README 里把核心策略分成四类:

  • Smart Filtering:去掉噪音,比如空白、样板信息、无关行。
  • Grouping:把相似结果合并,比如按目录、错误类型分组。
  • Truncation:保留关键上下文,裁掉重复内容。
  • Deduplication:重复日志折叠成计数。

RTX工作原理:

所以 RTK 不是简单截断输出,而是按命令类型做结构化压缩。

4. 常用命令

文件和搜索:

rtk ls .
rtk read file.rs
rtk read file.rs -l aggressive
rtk smart file.rs
rtk find "*.rs" .
rtk grep "pattern" .
rtk diff file1 file2

Git:

rtk git status
rtk git log -n 10
rtk git diff
rtk git add
rtk git commit -m "msg"
rtk git push
rtk git pull

测试:

rtk jest
rtk vitest
rtk playwright test
rtk pytest
rtk go test
rtk cargo test
rtk test npm test
rtk err npm run build

构建和 lint:

rtk lint
rtk tsc
rtk next build
rtk prettier --check .
rtk cargo build
rtk cargo clippy
rtk ruff check

容器和日志:

rtk docker ps
rtk docker images
rtk docker logs <container>
rtk kubectl pods
rtk kubectl logs <pod>
rtk log app.log

统计:

rtk gain
rtk gain --graph
rtk gain --history
rtk gain --daily
rtk discover
rtk session

5. 自动改写的边界

RTK hook 只拦截 Bash 工具调用。

Claude Code 内置的这些工具不会自动经过 RTK:

Read
Grep
Glob

如果你希望读取文件或搜索结果也走 RTK,需要让 Claude 使用 shell 命令,或者手动调用:

rtk read src/main.ts
rtk grep "keyword" .
rtk find "*.vue" .

6. Windows 注意事项

RTK 支持 Windows,但原生 Windows 下 hook 自动改写能力有限。

README 推荐在 Windows 上使用 WSL。WSL 里可以获得完整 hook 支持。

原生 Windows 可以这样用:

rtk init -g
rtk cargo test
rtk git status

但命令通常不会像 Linux / macOS / WSL 那样自动透明改写。

7. 什么时候用 RTK?

适合用:

  • 测试输出很长
  • 构建失败日志很多
  • git diff 很大
  • 搜索结果很多
  • Docker / Kubernetes / AWS 命令输出很吵

不适合只靠 RTK 解决:

  • Claude 回复太啰嗦
  • Claude 读了太多源码文件
  • 需要逐行分析完整日志

如果你必须保留完整日志,可以用:

npm run build 2>&1 | tee /tmp/build.log

然后让 Claude 只看关键片段:

tail -n 120 /tmp/build.log

二、Caveman:压缩 Claude 回复

Caveman 是一个 Claude Code skill / plugin,也支持 Codex、Gemini CLI、Cursor、Windsurf、Cline 等多种 AI 编程工具。

它的核心目标是让 agent 用更短的方式表达同样的技术内容。

README 里的示例很直观:

  • 普通表达:解释原因、背景、建议,比较长。
  • Caveman 表达:直接给根因和修复建议。

它主要省的是输出 Token。

1. 安装 Caveman

一键安装:

curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

Windows PowerShell:

irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

Claude Code 手动安装:

claude plugin marketplace add JuliusBrussee/caveman
claude plugin install caveman@caveman

通过 skills 安装:

npx skills add JuliusBrussee/caveman

安装脚本支持一些参数:

参数作用
--minimal只安装插件 / 扩展,不装 hooks、MCP shrink 等额外内容
--all安装完整配置,并在当前目录写入规则文件
--dry-run预览,不写文件
--only <agent>只给指定 agent 安装
--force强制重新安装
--list打印支持的 agent 列表

2. 开启和关闭

Claude Code 里开启:

/caveman

也可以直接用自然语言触发:

开启 Caveman 模式,回答尽量短一点。
用更精简的方式回复,少说客套话。
进入省 Token 模式,只保留关键结论。

关闭时可以说:

退出 Caveman 模式,恢复正常回答。
恢复正常模式。
这次请完整解释,不要过度压缩。

Codex 里 README 提到使用 $caveman

3. 压缩强度

Caveman 有几档模式:

模式触发方式说明
Lite/caveman lite去掉填充词,保留正常语法
Full/caveman full默认 caveman 风格,更短,句子更碎
Ultra/caveman ultra最大压缩,类似电报风格

README 还提供了文言文模式:

模式触发方式说明
Wenyan-Lite/caveman wenyan-lite半文言,仍保留可读性
Wenyan-Full/caveman wenyan更完整的文言压缩
Wenyan-Ultra/caveman wenyan-ultra极限文言压缩

日常建议:

普通编码:/caveman lite
短 review / commit:/caveman full
极限压缩演示:/caveman ultra
复杂设计讨论:normal mode

4. Caveman 技能命令

README 里列了一些常用能力:

/caveman-commit
/caveman-review
/caveman-help
/caveman-stats
/caveman:compress <file>

用途大概是:

命令用途
/caveman-commit生成简短 commit message,偏 Conventional Commits 风格
/caveman-review生成一行式 PR review 评论
/caveman-help查看模式、技能、命令
/caveman-stats查看 Claude Code 会话 token 使用和估算节省
/caveman:compress <file>压缩记忆文件,例如 CLAUDE.md

/caveman:compress <file> 会把文件改写成更短格式,并保留备份。适合压缩长期会被自动加载的记忆文件,但不要直接拿它压缩重要规范文档,最好先 review diff。

5. Caveman 适合什么?

适合:

  • 日常 bugfix
  • 简短代码分析
  • commit message
  • PR review
  • 改完代码后的验证总结
  • 高频 Claude Code 会话

不适合:

  • 教程文章
  • 复杂架构设计
  • 需求澄清
  • 需要完整推理过程的排查

核心原则:

需要短结论:开 Caveman。
需要完整解释:关 Caveman。

三、RTK 和 Caveman 怎么搭配?

两个工具可以一起用,因为它们优化的是不同阶段。

命令执行阶段:RTK 压缩工具输出
Claude 回复阶段:Caveman 压缩最终表达

推荐组合:

brew install rtk
rtk init -g

然后重启 Claude Code,进入会话后:

/caveman lite

日常提问可以这样写:

只读取和当前任务直接相关的文件。
如果需要跑命令,优先保留关键错误,不贴完整日志。
输出简洁,但不要省略风险和验证结果。

对于短任务:

/caveman full

对于复杂排查:

normal mode

推荐工作流

1. 用 RTK 常驻压缩 Bash 命令输出。

2. 默认开 /caveman lite,减少回复废话。

3. 写 commit、review 时用 /caveman full。

4. 做架构设计、复杂排查时切回 normal mode。

5. 遇到疑难日志,保存原始日志,再只给 Claude 看关键片段。

四、会不会降智?

RTK 一般不会让模型降智,因为它主要去掉命令输出里的噪音。

但它可能漏掉长日志中的细节。排查疑难问题时,建议保留原始日志。

Caveman 也不是减少模型思考,而是减少表达长度。

ultra 模式可能太短,不适合复杂任务。

比较稳的原则是:

可以省:

  • 客套话
  • 重复总结
  • 长日志噪音
  • 无关上下文

不要省:

  • 关键需求
  • 关键错误
  • 关键代码
  • 风险说明

五、最终建议

如果你只是想快速省 Token:

brew install rtk
rtk init -g

然后在 Claude Code 里:

/caveman lite

这是最推荐的默认组合。

如果你经常让 Claude 跑测试、看 diff、查日志,RTK 的收益会更明显。

如果你觉得 Claude 回答太长、太客套,Caveman 的收益会更明显。

以上就是一文分享Claude Code中省Token的小妙招的详细内容,更多关于Claude Code省Token技巧的资料请关注脚本之家其它相关文章!

相关文章

  • 2026年最值得安装的10个Claude Code Skills推荐

    ClaudeCodeSkills是ClaudeCode的扩展能力系统,通过安装特定的Skills,让AI在特定领域表现得更专业,文章介绍了10个精选Skills,涵盖编程、设计、内容创作、营销、办公等领域,
    2026-05-09
  • Windows安装Claude Code的完整教程

    Claude Code 是 Anthropic 推出的官方 AI 编程助手,支持命令行、IDE 扩展等多种使用方式,本文将详细介绍在 Windows 系统上安装和配置 Claude Code 的完整流程,帮助开发者
    2026-05-09
  • Claude Code完整指南:MCP、Skills、第三方模型配置一次搞定

    Claude Code 是 Anthropic 官方出的命令行工具,直接在终端里跟 Claude 交互,干的事情就是帮你写代码、改代码、跑命令,本文给大家介绍了Claude Code 完整上手指南,MCP、S
    2026-05-08
  • VScode如何使用Claude Code接入Deepseek

    本文介绍了VScode如何使用Claude Code接入Deepseek,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习
    2026-05-08
  • Claude Code连接MySQL的保姆级教程

    本教程详细介绍了如何让Claude Code与MySQL数据库建立连接,通过安装mcp-server-mysql作为中间件,用户可以通过两种方式配置连接,需要的朋友可以参考阅读本文
    2026-05-07
  • 国内直连Claude Code桌面版的全过程:接入全球AI大模型

    最新版 Claude Code Desktop(桌面版)已经支持通过图形化界面配置第三方大模型,对于不想反复折腾 CLI、环境变量和本地配置文件的用户来说,这个更新非常实用,本文就给大家
    2026-05-07
  • Claude Code接入国产大模型(GLM/Qwen)配置全解析

    本文介绍了如何将Claude Code接入国产大模型(GLM/Qwen)的配置方法,并列举了几常见问题和解决方案,文末还总结了配置方法和模型分层建议,希望对大家有一定的帮助
    2026-05-07
  • 本地安装Claude Code+自定义API接口的全配置指南

    Claude Code 是Anthropic官方推出的AI 编程助手,可以直接在终端、VS Code、JetBrains 等 IDE 中使用,本文详细介绍了Claude Code的安装方法、环境要求、首次登录步骤以及如
    2026-05-06
  • 在Claude Code中接入DeepSeek-V4的完整指南

    Claude Code的价值,在于把代码理解、修改、执行和验证整合进同一条工作链路,如果你已经在使用Claude Code,又希望把底层模型切换到DeepSeek-V4,这篇文章可以直接帮你完
    2026-05-06
  • claude code添加 andrej-karpathy-skills的实现步骤

    andreuserandrepathy-skills是为AI编程设计的指导框架,旨在减少编程错误并pathy-skills,本文就来详细的介绍一下claude code添加 andrej-karpathy-skills的实现,感兴趣的可
    2026-05-06

最新评论