cost-budgetlisted

Cost & Token Budget Baseline
pcliangx/AppGenesisForge · ★ 9 · AI & Automation · score 71

Install: claude install-skill pcliangx/AppGenesisForge

# Cost & Token Budget Baseline Agent Team 是吞 token 最快的协作形态——多个 teammate 各持独立上下文 × 长会话 × 多轮对话，单功能消耗很容易冲到几百万 token。本基线规定团队必须遵守的预算纪律与可验证的事后核账机制。 ## 预算分级（默认值；项目可在 CLAUDE.md 覆盖） | 任务规模 | 单次会话 token 上限（输入+输出合计） | 触发提示 | 触发硬停 | |---|---|---|---| | 小（单文件 / bugfix / 查询） | 100k | 80k | 150k | | 中（功能开发 / 跨模块重构） | 500k | 400k | 800k | | 大（完整 feature / 跨链路 PRD→UAT） | 2M | 1.6M | 3M | > 这是**对话窗口**预算，不是 API 总账户预算。账户级预算由账单系统单独控制。 ## 角色级纪律 - **product-lead**：每次拆任务前评估规模等级；规模超「中」必须在 PRD 顶部声明预估 token 与成本 - **tech-lead / 执行层**：发现自己即将超过单次「触发提示」阈值时主动 SendMessage product-lead 汇报进度并请示是否继续 - **任何 agent**：撞到「触发硬停」阈值时必须立即停下，不得擅自续跑 ## Cache 利用率（必须 ≥ 60%） - 高 cache miss 源于模板化文档过长 / agent 频繁切换；连续两次会话 cache hit < 50% 应触发优化 - 优化路径：把不常变的内容下沉到 skill / plugin skills、避免在 CLAUDE.md 反复改大段 - Sub-agent progress summaries 自 Claude Code 2.1.128 起走 prompt cache（`cache_creation` ~3× 减少），并在 idle subagent 上不再重复触发——Parallel Dispatch 多 teammate 场景的成本基线随之下移，看历史月度账单时若 sub-agent 占比突然下降无需调查 - 参考：[Anthropic Prompt Caching](https://docs.claude.com/en/docs/build-with-claude/prompt-caching)、[Reduce Token Usage](https://code.claude.com/docs/en/costs#reduce-token-usage) ## 模型降级路径（建议）不是所有任务都需要 Opus。product-lead 判断任务足够明确、不涉及架构权衡时，鼓励 teammate 主动降级到 Sonnet 甚至 Haiku： | 任务特征 | 推荐模型 | |---|---| | 架构决策 / 复杂权衡 / brainstorm | Opus | | 标准 CRUD / 文档撰写 / 代码评审 | Sonnet | | 文本提取 / 简单格式化 / 测试样板 | Haiku | 降级是工具，不是义务——若 Sonnet 多次产出不达预期，立即升回 Opus 别硬撑。 ## Agent 默认 Model 路由（基线）下表是 14 个 agent 的默认 model 选型与理由。任意调整需在 PRD 顶部备注复核效果： | Agent |