← ClaudeAtlas

cost-budgetlisted

Cost & Token Budget Baseline
pcliangx/AppGenesisForge · ★ 9 · AI & Automation · score 71
Install: claude install-skill pcliangx/AppGenesisForge
# Cost & Token Budget Baseline Agent Team 是吞 token 最快的协作形态——多个 teammate 各持独立上下文 × 长会话 × 多轮对话,单功能消耗很容易冲到几百万 token。本基线规定团队必须遵守的预算纪律与可验证的事后核账机制。 ## 预算分级(默认值;项目可在 CLAUDE.md 覆盖) | 任务规模 | 单次会话 token 上限(输入+输出合计) | 触发提示 | 触发硬停 | |---|---|---|---| | 小(单文件 / bugfix / 查询) | 100k | 80k | 150k | | 中(功能开发 / 跨模块重构) | 500k | 400k | 800k | | 大(完整 feature / 跨链路 PRD→UAT) | 2M | 1.6M | 3M | > 这是**对话窗口**预算,不是 API 总账户预算。账户级预算由账单系统单独控制。 ## 角色级纪律 - **product-lead**:每次拆任务前评估规模等级;规模超「中」必须在 PRD 顶部声明预估 token 与成本 - **tech-lead / 执行层**:发现自己即将超过单次「触发提示」阈值时主动 SendMessage product-lead 汇报进度并请示是否继续 - **任何 agent**:撞到「触发硬停」阈值时必须立即停下,不得擅自续跑 ## Cache 利用率(必须 ≥ 60%) - 高 cache miss 源于模板化文档过长 / agent 频繁切换;连续两次会话 cache hit < 50% 应触发优化 - 优化路径:把不常变的内容下沉到 skill / plugin skills、避免在 CLAUDE.md 反复改大段 - Sub-agent progress summaries 自 Claude Code 2.1.128 起走 prompt cache(`cache_creation` ~3× 减少),并在 idle subagent 上不再重复触发——Parallel Dispatch 多 teammate 场景的成本基线随之下移,看历史月度账单时若 sub-agent 占比突然下降无需调查 - 参考:[Anthropic Prompt Caching](https://docs.claude.com/en/docs/build-with-claude/prompt-caching)、[Reduce Token Usage](https://code.claude.com/docs/en/costs#reduce-token-usage) ## 模型降级路径(建议) 不是所有任务都需要 Opus。product-lead 判断任务足够明确、不涉及架构权衡时,鼓励 teammate 主动降级到 Sonnet 甚至 Haiku: | 任务特征 | 推荐模型 | |---|---| | 架构决策 / 复杂权衡 / brainstorm | Opus | | 标准 CRUD / 文档撰写 / 代码评审 | Sonnet | | 文本提取 / 简单格式化 / 测试样板 | Haiku | 降级是工具,不是义务——若 Sonnet 多次产出不达预期,立即升回 Opus 别硬撑。 ## Agent 默认 Model 路由(基线) 下表是 14 个 agent 的默认 model 选型与理由。任意调整需在 PRD 顶部备注复核效果: | Agent |