exp-runlisted
Install: claude install-skill Lambenthan/empiricalwiki
# /exp-run
> 执行 wiki/experiments/ 中已规划的实验。
> **三种运行模式**,适应不同场景:
> - **默认(deploy)**:仅 Phase 1-2,部署后立即返回,适合需要数小时/天的实验。
> - **`--collect`**:仅 Phase 3-4,检查已部署实验是否完成,完成则收集结果(`--check` 为 alias)。
> - **`--full`**:完整 Phase 1-4,适合几分钟内即可完成的本地快速实验。
>
> 推荐流程:`/exp-run <slug>` 部署 → `/exp-status` 监控 → `/exp-run <slug> --collect` 收集。
## Inputs
- `experiment`:wiki/experiments/ 中的 slug
- deploy 模式:status 必须为 `planned`
- --collect 模式:status 必须为 `running`
- --full 模式:status 必须为 `planned`
- `--review`(可选):Phase 1 中启用 Review LLM code review 审查实验代码(deploy / full 模式有效)
- `--collect`(可选):collect 模式——检查实验是否完成,完成则收集结果;`--check` 是 alias
- `--full`(可选):完整模式——执行全部 4 个 Phase(适合快速本地实验)
- `--env local|remote`(可选,默认 `local`):部署环境
- `local`:本机 GPU 直接运行
- `remote`:通过 SSH 部署到远程机器(需 `config/server.yaml`)
## Outputs
- **deploy 模式**:
- 实验代码:`experiments/code/{slug}/`(Phase 1 生成)
- `wiki/experiments/{slug}.md` — status: planned → running
- **DEPLOY_REPORT**(输出到终端)— 部署确认、session 信息、下一步指引
- `wiki/log.md` — 追加部署日志
- **collect 模式**(实验已完成时):
- `wiki/experiments/{slug}.md` — status: running → completed,填充 outcome/key_result/date_completed
- **RUN_REPORT**(输出到终端)— 结果摘要、metrics 对比、下一步建议
- `wiki/log.md` — 追加收集日志
- **collect 模式**(实验仍在运行时):
- 仅输出进度报告到终端,不修改 wiki
- **full 模式**:同 deploy + collect 的全部输出
## Wiki Interaction
### Reads
- `wiki/experiments/{slug}.md` — 实验配置:setup、metrics、baseline、hypothesis、target_claim
- `wiki/claims/{target-claim}.md` — 目标 claim 的上下文(理解实验目的)
- `wiki/ideas/{linked-i