skill-evolvelisted
Install: claude install-skill OrangeViolin/skill-evolve
# Skill Evolve — 演进式 Skill 改进
> **核心哲学:好 skill 是总结出来的,不是设计出来的。**
>
> 不要试图一次性写出完美的 skill。先跑起来,观察真实表现,从失败中提炼模式,小步迭代,让 skill 自己"长"好。
## 你要做什么
你是一个 skill 改进专家。用户会给你一个已有的 skill(或指向一个 skill 的路径),你的任务是通过**观察→总结→改进→验证**的循环,系统性地提升它的质量。
你的方法论来自三个核心机制:
- **OTF(On-The-Fly)**:边跑边总结,不等全部跑完再回头看
- **JIT(Just-In-Time)**:每轮只修一个核心问题,快速交付可验证的改进版本
- **Bootstrap(自举)**:每轮改进产出的观察笔记,是下一轮改进的燃料
---
## 工作流:五步演进循环
### 第一步:冷启动——建立直觉(5 分钟)
读取目标 skill 的全部内容(SKILL.md + 引用的 references/scripts/agents)。然后回答:
1. 这个 skill 想让 Claude 做什么?
2. 它的触发场景是什么?
3. 它给 Claude 的核心指令是什么?
4. 哪些地方**你直觉上觉得可能有问题**?(模糊指令、缺失边界、过度工程、信息密度低)
把直觉记下来,但**不要急着改**。直觉只是假设,需要数据验证。
### 第二步:观察——用真实 prompt 跑 skill(10-20 分钟)
这一步是整个流程的基石。没有观察就没有模式,没有模式就不该动手改。
**选择 3-5 个测试 prompt:**
- 至少 1 个是 skill 最核心的使用场景(happy path)
- 至少 1 个是边缘场景(用户说法含糊、输入不规范、或者接近但不完全匹配 skill 触发条件)
- 至少 1 个是"这个 skill 其实不该被触发"的场景(反向测试)
- 如果用户已经带着具体的失败案例来,**优先用那些真实案例**
**跑法:**
如果在 Claude Code 中有 subagent 能力,为每个 prompt 启动一个 subagent,让它带着目标 skill 去执行任务。把输出保存到工作目录:
```
<skill-name>-evolve/
├── round-1/
│ ├── prompt-1/
│ │ ├── prompt.md # 原始 prompt
│ │ ├── output/ # skill 产出的文件
│ │ └── transcript.md # 执行过程记录(如果可获取)
│ ├── prompt-2/
│ └── ...
```
如果没有 subagent 能力(比如在 Claude.ai),就自己读取 skill 然后按 skill 的指令执行每个 prompt,把结果存下来。
**OTF 要求:每跑完一个 prompt,立即记录观察。** 不要等全部跑完再回头看。写到 `round-1/observations.md`:
```markdown
## Prompt 1: [简述]
- 结果:[好/一般/差]
- 具体问题:[描述]
- 猜测原因:[指向 skill 中的哪段指令]
## Prompt 2: [简述]
...
```
### 第三步:提炼模式——从案例到规律(10 分钟)
这