light-research-planlisted

对已确认可行的 idea 制定极其详细的研究方案、实验设计与执行规划。当用户的 idea 已通过 m04 审查、需要把 idea 拆成可执行可复现的完整科研流程时使用。覆盖研究目标、技术路线、数据流程、实验/消融/敏感性/鲁棒性/显著性检验、时间安排、风险与备选，并保证全程可复现。
Light0305/Light-skills · ★ 77 · AI & Automation · score 85

Install: claude install-skill Light0305/Light-skills

# 研究方案与实验执行规划 ## 前置仅对 m04 已放行的 idea 执行。开工前确认数据(m02)与方法(db03)就绪。 ## 方案内容（逐项写实，不写空话） 1. **研究目标 & 核心问题**：可证伪的假设 H1/H2…。 2. **技术路线**：整体框架图（交 m09/m11），关键模块与数据流。 3. **数据**：来源、处理流程(引 m02 流水线)、划分方式、统计。 4. **模型/方法**：算法流程、公式、伪代码、复杂度。 5. **实验设计**：每个实验条目按 EXP-Bench 四要素写全 —— 研究问题(对应哪条假设)、设计(自/因/控变量+数据集+baseline+指标)、实现(代码+运行配置)、结论判定(用什么结果回答该假设)。"设计"和"结论"最易跑偏，重点核。 - 主实验：任务、数据集（来自 db04：规模/划分/许可/已知问题）、baselines（来自 db03）、评价指标。 - 消融实验：逐个移除创新组件，证明贡献来源。 - 对比实验：与 SOTA 公平比较（同数据/同设置）。 - 参数敏感性：关键超参网格 + 趋势分析。用 Hydra multirun（`-m lr=0.01,0.1 model=a,b` 笛卡尔积）或 W&B Sweeps（method=grid/random/bayes + metric goal + parameters）系统扫参。 - 泛化测试：跨数据集/跨域/跨规模。 - 鲁棒性：噪声/对抗/缺失/分布漂移。 - 统计显著性：≥3~5 个随机种子；推断用 statsmodels（OLS/Logit，看 summary 的 p 值与 95% 置信区间，记得 `add_constant`）或 scipy（t-test/Wilcoxon）；需不确定性量化时上 PyMC（看 r_hat≈1、ESS 足够）。报均值±标准差 + 误差棒。 - 防泄漏：所有依赖训练集统计量的预处理（标准化/填补/编码）必须封进 sklearn Pipeline + ColumnTransformer，再交给交叉验证，禁止对全量数据先 fit。 6. **可视化方案**：要出哪些图表（交 m09）。 7. **时间安排**：里程碑 + 甘特，对齐 deadline。 8. **风险点 & 备选方案**：每个风险配 plan B。 9. **预期成果**：论文层次/竞赛/专利/软著。 ## 可复现规划（硬性）逐项落实，给出具体配置而非工具名： - **环境**：OS/驱动/CUDA 记录；依赖锁版本（requirements.txt 固定版本 / environment.yml / lockfile）。 - **目录脚手架**：按 Cookiecutter Data Science 布局——`data/{raw,interim,processed,external}`(raw 只读不改)、`src/`(可复用逻辑下沉，notebook 不放核心逻辑)、`models/`、`reports/figures/`、`Makefile`、`README`。 - **配置管理**：Hydra 分层配置（conf/ 下 model、dataset 分组 + defaults 列表组合），命令行可覆盖 `lr=0.1`，run 自动存最终合成配置。 - **数据/模型版本**：DVC——`dvc add` 跟踪大文件(git 只存 .dvc 指针)，`dvc.yaml`