模式 1:Haiku 测试 + Sonnet 实现
# 终端 1:测试生成(Haiku)claude --model haikuYou: "Generate tests for the auth module"
# 终端 2:实现(Sonnet)claude --model sonnetYou: "Implement the auth module"本指南介绍最小化 API 成本同时最大化生产力的实用技巧,包括模型选择、Token 节省技巧、RTK 工具、成本追踪和经济工作流模式。
选择合适的模型,平衡成本与能力。
# 激活 OpusPlan 模式/model opusplan
# 进入 Plan 模式(Opus 规划)Shift+Tab × 2
You: "Design a caching layer for the API"# Opus 创建详细的架构方案
# 退出 Plan 模式(Sonnet 执行)Shift+Tab
You: "Implement the caching layer following the plan"# Sonnet 以更低成本执行方案| 文件大小 | 大约 Token 数 | 影响 |
|---|---|---|
| 50 行 | 500-1,000 tokens | 最小(推荐) |
| 100 行 | 1,000-2,000 tokens | 可接受 |
| 200 行 | 2,000-3,500 tokens | 上限 |
| 500+ 行 | 5,000+ tokens | 考虑拆分 |
# 差:臃肿的 CLAUDE.md(每次会话浪费 token)- 500+ 行指令- 多个 @includes 导入其他文件- 很少使用的准则
# 好:精简的 CLAUDE.md- 仅包含必要的项目上下文(<200 行)- 将专门规则移至 .claude/rules/(会话启动时自动加载)- 按关注点拆分:团队规则在项目 CLAUDE.md,个人偏好在 ~/.claude/CLAUDE.md# 差:模糊请求(Claude 读取多个文件找上下文)"Fix the authentication bug"
# 好:精确请求(Claude 只读取需要的内容)"Fix the JWT validation in @src/auth/middleware.ts line 45"# 差:等到 90% 上下文/status # Context: 92% - 太晚了,性能已下降
# 好:在 70% 时 Compact/status # Context: 72%/compact # 释放上下文,保持性能---name: test-writerdescription: Generate unit tests (use for test generation only)model: haiku---
Generate comprehensive unit tests with edge cases.好处:Haiku 成本低于 Sonnet、聚焦上下文(仅测试)、更快执行。
# 差:每个修复单独会话claude -p "Fix typo in auth.ts"claude -p "Fix typo in user.ts"claude -p "Fix typo in api.ts"
# 好:在单个会话中批量处理claudeYou: "Fix typos in auth.ts, user.ts, and api.ts"# 单次上下文加载,多次修复RTK(Rust Token Killer) 在 bash 命令输出到达 Claude 上下文之前进行过滤,在 Git、测试和开发工作流中实现 60-90% 的 Token 减少。
# 选项 1: Homebrew (macOS/Linux)brew install rtk-ai/tap/rtk
# 选项 2: Cargo (所有平台)cargo install rtk
# 选项 3: 安装脚本curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/main/install.sh | bash| 命令 | 原始大小 | RTK 处理后 | 减少率 |
|---|---|---|---|
rtk git log | 13,994 字符 | 1,076 字符 | 92.3% |
rtk git status | 100 字符 | 24 字符 | 76.0% |
rtk git diff | 15,815 字符 | 6,982 字符 | 55.9% |
rtk vitest run | ~50,000 字符 | ~5,000 字符 | 90.0% |
rtk pnpm list | ~8,000 字符 | ~2,400 字符 | 70.0% |
rtk git logrtk git statusrtk git diff HEAD~1rtk vitest run # 测试结果精简rtk pnpm list # 依赖树优化rtk prisma migrate status # 迁移状态过滤rtk python pytest # Python 测试输出精简rtk go test # Go 测试结果过滤rtk cargo test # Cargo 测试输出精简rtk cargo clippy # Lint 按严重性分组rtk init # 初始化 RTK(hook 优先安装)rtk tree # 项目结构精简rtk gain # Token 节省仪表盘rtk discover # 发现优化机会30 分钟 Claude Code 会话:- 无 RTK:~150K tokens(10-15 个 git 命令 @ ~10K tokens 每个)- 有 RTK:~41K tokens(10-15 个 git 命令 @ ~2.7K tokens 每个)- 节省:109K tokens(72.6% 减少)Hook 优先安装(推荐)
rtk init # 自动设置 PreToolUse hookCLAUDE.md 指令(手动包装)
## Token OptimizationUse RTK for all supported commands:- `rtk git log` (92.3% reduction)- `rtk git status` (76.0% reduction)- `rtk git diff` (55.9% reduction)Skill(自动建议)
检测高冗余命令,自动建议 RTK 包装。
Hook(自动包装)
PreToolUse hook 拦截 bash 命令,在有益时应用 RTK 包装。
/status
# 输出:Model: Sonnet | Ctx: 45.2k | Cost: $1.23 | Ctx(u): 42.0%# 如果直接使用 Anthropic APIimport anthropic
client = anthropic.Anthropic()
response = client.messages.create( model="claude-sonnet-4-5", max_tokens=1024, messages=[...], metadata={ "user_id": "user_123", "project": "api_development" })
# 记录每次请求的成本cost = calculate_cost(response.usage)if cost > BUDGET_THRESHOLD: alert_team(f"Budget threshold exceeded: ${cost}")## CLAUDE.md - Cost Awareness
**Budget-conscious mode:**- Use Haiku for reviews and simple tasks- Reserve Sonnet for feature work- Use Opus only for critical decisions- Compact context at 70% to avoid waste- Close sessions after task completion模式 1:Haiku 测试 + Sonnet 实现
# 终端 1:测试生成(Haiku)claude --model haikuYou: "Generate tests for the auth module"
# 终端 2:实现(Sonnet)claude --model sonnetYou: "Implement the auth module"模式 2:渐进式模型升级
# 从 Haiku 开始claude --model haikuYou: "Review this code for obvious issues"
# 发现复杂问题,升级到 Sonnet/model sonnetYou: "Deep analysis of the race condition"
# 如果是架构问题,升级到 Opus/model opusYou: "Redesign the concurrency model"# 构建一次上下文,多次复用claudeYou: "Analyze the authentication flow"# 上下文已构建:~20k tokens
# 同一会话 - 上下文已加载You: "Now add 2FA to the authentication flow"# 无需重建上下文
You: "Generate tests for the 2FA feature"# 仍然使用同一上下文
# 完成后提交You: "Create commit for 2FA implementation"输入 Token:源代码上下文、对话历史、Memory 文件(CLAUDE.md)、Agent/Skill 指令
输出 Token:Claude 的回复、生成的代码、解释
上下文加载:- 10 个文件 × 500 LOC × 4 tokens/LOC = 20,000 tokens- 对话历史: 5,000 tokens- CLAUDE.md: 1,000 tokens总输入: 26,000 tokens
Claude 响应:- 生成代码: 500 LOC × 4 = 2,000 tokens- 解释: 500 tokens总输出: 2,500 tokens
每次交互总成本: (26,000 + 2,500) tokens × 模型价格输入: $3 / 百万 tokens输出: $15 / 百万 tokens
会话成本:输入: 26,000 × $3 / 1,000,000 = $0.078输出: 2,500 × $15 / 1,000,000 = $0.0375总计: ~$0.12 每次交互日常实践:□ 使用 /status 监控上下文和成本□ 在 70% 上下文使用量时执行 Compact□ 任务完成后关闭会话□ 使用 permissions.deny 屏蔽敏感文件
模型选择:□ 大多数工作默认使用 Sonnet□ 审查和简单修复使用 Haiku□ 架构和关键调试保留使用 Opus□ 尝试 OpusPlan 模式处理战略性工作
上下文管理:□ 使用精确文件引用(@path/to/file.ts)□ 在单个会话中批量处理相似任务□ 对多个相关任务复用上下文□ 创建带聚焦上下文的专业化 Agent
团队实践:□ 在团队 wiki 中分享成本有效的模式□ 按项目追踪支出□ 为高成本操作设置预算提醒□ 在回顾会议中审查成本指标对于高频使用者,可以考虑 cc-copilot-bridge 通过 GitHub Copilot Pro+($10/月固定费)路由请求,替代按 Token 计费。
# 切换到 Copilot 模式(固定费率)ccc # 使用 Copilot Pro+ 订阅
# 切回 Anthropic(按 Token 计费)ccd # 使用 ANTHROPIC_API_KEY适用场景:
name: Claude Code Reviewon: [pull_request]jobs: review: runs-on: ubuntu-latest steps: - uses: actions/checkout@v3
# 使用 Haiku 进行成本有效的审查 - name: Run Claude review run: | claude --model haiku \ -p "Review changes for security and style issues" \ --add-dir src/ \ --output-format json > review.json
# 仅在发现问题时升级到 Sonnet - name: Deep analysis (if needed) if: contains(steps.*.outputs.*, 'CRITICAL') run: | claude --model sonnet \ -p "Detailed analysis of critical issues found" \ --add-dir src/Haiku 审查(每 PR):~$0.02Sonnet 审查(每 PR):~$0.10Opus 审查(每 PR):~$0.50
每月 100 个 PR:- 全部 Haiku:$2/月- 全部 Sonnet:$10/月- 全部 Opus:$50/月
智能升级(Haiku → 10% PR 升级到 Sonnet):- 基础成本:$2(Haiku 处理所有)- 升级成本:$1(Sonnet 处理 10%)- 总计:$3/月(vs $10 或 $50)错误的经济观
聪明的优化