cheat-bumplisted

提议并执行 rubric 或 bucket 升级。两种模式：**完整 rubric bump**（最高风险动作，5 步强制 + 跨模型审核）和 **--bucket-only 轻量重校**（只换 bucket 边界，不动 rubric 公式）。**Phase 2 强制走 cheat-score-blind sub-agent 给校准池重打分**——不接受 self-scored fallback。触发词："升级 rubric"/"bump rubric"/"更新公式"/"我想加一个维度"/"调整权重"/"重校桶"/"recalibrate bucket"。
LiHongwei-cn/lihongwei-cn · ★ 9 · AI & Automation · score 79

Install: claude install-skill LiHongwei-cn/lihongwei-cn

# /cheat-bump — Rubric / Bucket 升级两种模式： | 模式 | 触发 | 做什么 | 验证强度 | |---|---|---|---| | **完整 rubric bump** | `--propose "<新公式>"` | 改公式 / 维度 / 权重 | 5 步 + 跨模型审核（强制） | | **bucket-only 重校** | `--bucket-only` | 只重新派生 bucket 边界 | 数据自动派生，无审核 | 完整 rubric bump 严格遵守 [shared-references/bump-validation-protocol.md](../../shared-references/bump-validation-protocol.md) 的 5 步。bucket-only 走轻量路径——见下方 Phase B。 ## Overview ``` 入口：用户触发 /cheat-bump ↓ [Phase A0: 检测调用模式] ↓ ├─ --bucket-only → [Phase B: 轻量 bucket 重校] └─ --propose → [Phase 0~6: 完整 rubric bump] ``` ## Phase A0: 调用模式分流（先做）读用户参数： - 含 `--bucket-only` → 走 **Phase B**（轻量重校） - 含 `--propose "<...>"` → 走 **Phase 0~8**（完整 rubric bump） - 都没有 → 询问用户："你想做什么？1) 调 rubric 公式 / 加减维度 → --propose；2) 只重新派生 bucket 边界 → --bucket-only" 如果用户说"我觉得 ER 太低了想调"→ 是 `--propose` 路径。如果用户说"我账号长大了，bucket 不准了"→ 是 `--bucket-only` 路径。 **两条路径不能混调**——一次操作只做一种事。 --- ## 完整 rubric bump 流程 ``` [用户：升级 rubric --propose "ER×1.5→2.0，砍 NA，加 MS"] ↓ [Phase 0: 前置门槛检查] ↓ [Phase 1: 写出新公式完整方程] ↓ [Phase 2: 校准池全量重打分] ↓ [Phase 3: 计算排序一致性] ↓ [Phase 4: 跨模型独立审核（强制）] ↓ [Phase 5: 落地 + cleanup pass] ↓ [Phase 6: 更新所有校准样本的 prediction 文件底部追加 Re-scored 行] ``` ## Constants - **READINESS_HEURISTIC** — - **默认参考**：校准池 ≥ 5 样本 + 至少 1 个跨样本观察有 ≥3 样本支持 - **但 Claude 可以提议 bump**（即使样本少）如果观察信号特别强： - N=3 但出现完全推翻当前 rubric 假设的强反例（composite 8.5 vs 实绩 5w 这种 ≥3x 偏差） - 1 篇出现单点但极强的现象（如评论区出现 ≥2000 赞的单一模因） - **Claude 也可以拒绝 bump**（即使样本足）如果证据弱： - N=10 但观察都是低置信度的零碎 p