exp-runlisted

实验执行全流程：准备代码 → 部署运行 → 监控状态 → 收集结果，支持三种运行模式
Lambenthan/empiricalwiki · ★ 45 · AI & Automation · score 79

Install: claude install-skill Lambenthan/empiricalwiki

# /exp-run > 执行 wiki/experiments/ 中已规划的实验。 > **三种运行模式**，适应不同场景： > - **默认（deploy）**：仅 Phase 1-2，部署后立即返回，适合需要数小时/天的实验。 > - **`--collect`**：仅 Phase 3-4，检查已部署实验是否完成，完成则收集结果（`--check` 为 alias）。 > - **`--full`**：完整 Phase 1-4，适合几分钟内即可完成的本地快速实验。 > > 推荐流程：`/exp-run <slug>` 部署 → `/exp-status` 监控 → `/exp-run <slug> --collect` 收集。 ## Inputs - `experiment`：wiki/experiments/ 中的 slug - deploy 模式：status 必须为 `planned` - --collect 模式：status 必须为 `running` - --full 模式：status 必须为 `planned` - `--review`（可选）：Phase 1 中启用 Review LLM code review 审查实验代码（deploy / full 模式有效） - `--collect`（可选）：collect 模式——检查实验是否完成，完成则收集结果；`--check` 是 alias - `--full`（可选）：完整模式——执行全部 4 个 Phase（适合快速本地实验） - `--env local|remote`（可选，默认 `local`）：部署环境 - `local`：本机 GPU 直接运行 - `remote`：通过 SSH 部署到远程机器（需 `config/server.yaml`） ## Outputs - **deploy 模式**： - 实验代码：`experiments/code/{slug}/`（Phase 1 生成） - `wiki/experiments/{slug}.md` — status: planned → running - **DEPLOY_REPORT**（输出到终端）— 部署确认、session 信息、下一步指引 - `wiki/log.md` — 追加部署日志 - **collect 模式**（实验已完成时）： - `wiki/experiments/{slug}.md` — status: running → completed，填充 outcome/key_result/date_completed - **RUN_REPORT**（输出到终端）— 结果摘要、metrics 对比、下一步建议 - `wiki/log.md` — 追加收集日志 - **collect 模式**（实验仍在运行时）： - 仅输出进度报告到终端，不修改 wiki - **full 模式**：同 deploy + collect 的全部输出 ## Wiki Interaction ### Reads - `wiki/experiments/{slug}.md` — 实验配置：setup、metrics、baseline、hypothesis、target_claim - `wiki/claims/{target-claim}.md` — 目标 claim 的上下文（理解实验目的） - `wiki/ideas/{linked-i