← ClaudeAtlas

exp-runlisted

实验执行全流程:准备代码 → 部署运行 → 监控状态 → 收集结果,支持三种运行模式
Lambenthan/empiricalwiki · ★ 45 · AI & Automation · score 79
Install: claude install-skill Lambenthan/empiricalwiki
# /exp-run > 执行 wiki/experiments/ 中已规划的实验。 > **三种运行模式**,适应不同场景: > - **默认(deploy)**:仅 Phase 1-2,部署后立即返回,适合需要数小时/天的实验。 > - **`--collect`**:仅 Phase 3-4,检查已部署实验是否完成,完成则收集结果(`--check` 为 alias)。 > - **`--full`**:完整 Phase 1-4,适合几分钟内即可完成的本地快速实验。 > > 推荐流程:`/exp-run <slug>` 部署 → `/exp-status` 监控 → `/exp-run <slug> --collect` 收集。 ## Inputs - `experiment`:wiki/experiments/ 中的 slug - deploy 模式:status 必须为 `planned` - --collect 模式:status 必须为 `running` - --full 模式:status 必须为 `planned` - `--review`(可选):Phase 1 中启用 Review LLM code review 审查实验代码(deploy / full 模式有效) - `--collect`(可选):collect 模式——检查实验是否完成,完成则收集结果;`--check` 是 alias - `--full`(可选):完整模式——执行全部 4 个 Phase(适合快速本地实验) - `--env local|remote`(可选,默认 `local`):部署环境 - `local`:本机 GPU 直接运行 - `remote`:通过 SSH 部署到远程机器(需 `config/server.yaml`) ## Outputs - **deploy 模式**: - 实验代码:`experiments/code/{slug}/`(Phase 1 生成) - `wiki/experiments/{slug}.md` — status: planned → running - **DEPLOY_REPORT**(输出到终端)— 部署确认、session 信息、下一步指引 - `wiki/log.md` — 追加部署日志 - **collect 模式**(实验已完成时): - `wiki/experiments/{slug}.md` — status: running → completed,填充 outcome/key_result/date_completed - **RUN_REPORT**(输出到终端)— 结果摘要、metrics 对比、下一步建议 - `wiki/log.md` — 追加收集日志 - **collect 模式**(实验仍在运行时): - 仅输出进度报告到终端,不修改 wiki - **full 模式**:同 deploy + collect 的全部输出 ## Wiki Interaction ### Reads - `wiki/experiments/{slug}.md` — 实验配置:setup、metrics、baseline、hypothesis、target_claim - `wiki/claims/{target-claim}.md` — 目标 claim 的上下文(理解实验目的) - `wiki/ideas/{linked-i