light-research-planlisted
Install: claude install-skill Light0305/Light-skills
# 研究方案与实验执行规划
## 前置
仅对 m04 已放行的 idea 执行。开工前确认数据(m02)与方法(db03)就绪。
## 方案内容(逐项写实,不写空话)
1. **研究目标 & 核心问题**:可证伪的假设 H1/H2…。
2. **技术路线**:整体框架图(交 m09/m11),关键模块与数据流。
3. **数据**:来源、处理流程(引 m02 流水线)、划分方式、统计。
4. **模型/方法**:算法流程、公式、伪代码、复杂度。
5. **实验设计**:每个实验条目按 EXP-Bench 四要素写全 —— 研究问题(对应哪条假设)、设计(自/因/控变量+数据集+baseline+指标)、实现(代码+运行配置)、结论判定(用什么结果回答该假设)。"设计"和"结论"最易跑偏,重点核。
- 主实验:任务、数据集(来自 db04:规模/划分/许可/已知问题)、baselines(来自 db03)、评价指标。
- 消融实验:逐个移除创新组件,证明贡献来源。
- 对比实验:与 SOTA 公平比较(同数据/同设置)。
- 参数敏感性:关键超参网格 + 趋势分析。用 Hydra multirun(`-m lr=0.01,0.1 model=a,b` 笛卡尔积)或 W&B Sweeps(method=grid/random/bayes + metric goal + parameters)系统扫参。
- 泛化测试:跨数据集/跨域/跨规模。
- 鲁棒性:噪声/对抗/缺失/分布漂移。
- 统计显著性:≥3~5 个随机种子;推断用 statsmodels(OLS/Logit,看 summary 的 p 值与 95% 置信区间,记得 `add_constant`)或 scipy(t-test/Wilcoxon);需不确定性量化时上 PyMC(看 r_hat≈1、ESS 足够)。报均值±标准差 + 误差棒。
- 防泄漏:所有依赖训练集统计量的预处理(标准化/填补/编码)必须封进 sklearn Pipeline + ColumnTransformer,再交给交叉验证,禁止对全量数据先 fit。
6. **可视化方案**:要出哪些图表(交 m09)。
7. **时间安排**:里程碑 + 甘特,对齐 deadline。
8. **风险点 & 备选方案**:每个风险配 plan B。
9. **预期成果**:论文层次/竞赛/专利/软著。
## 可复现规划(硬性)
逐项落实,给出具体配置而非工具名:
- **环境**:OS/驱动/CUDA 记录;依赖锁版本(requirements.txt 固定版本 / environment.yml / lockfile)。
- **目录脚手架**:按 Cookiecutter Data Science 布局——`data/{raw,interim,processed,external}`(raw 只读不改)、`src/`(可复用逻辑下沉,notebook 不放核心逻辑)、`models/`、`reports/figures/`、`Makefile`、`README`。
- **配置管理**:Hydra 分层配置(conf/ 下 model、dataset 分组 + defaults 列表组合),命令行可覆盖 `lr=0.1`,run 自动存最终合成配置。
- **数据/模型版本**:DVC——`dvc add` 跟踪大文件(git 只存 .dvc 指针),`dvc.yaml`