light-result-analysislisted
Install: claude install-skill Light0305/Light-skills
# 结果与数据深度分析
## 分析层次(逐层深入)
1. **描述**:指标汇总、分布、与 baseline 的差距,配误差棒/置信区间。
2. **解释**:为什么是这个结果?归因到方法的哪个组件(结合消融)。
3. **诊断**:哪些结果证明创新点有效,哪些反而暴露问题或矛盾。
4. **洞察**:能成为论文亮点的规律;意外发现;可解释性证据(SHAP/特征重要性/注意力)。
5. **行动**:哪些异常需排查,哪些结论需补实验验证,哪些不能过度声称。
## 必查清单
- 显著性:≥5 随机种子报均值±标准差;两组用 Welch t(不假设等方差)、非正态用 Mann-Whitney U、多组用 ANOVA+Tukey、比例用 two-proportion z-test。p 值 + 效应量(Cohen's d) + 置信区间三件套,别只报 p。多比较用 BH-FDR 校正(`multipletests(method="fdr_bh")`)。
- 一致性:跨数据集/跨设置是否稳定?哪里反常?
- 消融自洽:移除组件性能确实下降?方向对不对?用 anova_lm 或回归系数看组件贡献是否显著。
- 失败案例:错例分析找系统性偏差;用 SHAP(beeswarm/bar) 看模型实际依赖哪些特征是否合理。
- 公平性:对比是否同设置、同算力、同数据,避免不公平比较。
- 过拟合/泄漏:train/val/test 差距是否异常;特征-标签相关过高或时间穿越要查(deepchecks data_integrity / 漂移用 Evidently DataDriftPreset)。
## 工具与具体用法
- **快速体检**:`ProfileReport(df, minimal=True).to_file(...)` 一键出分布/缺失/相关/告警;deepchecks `data_integrity().run(Dataset(df,label=...))` 查泄漏/重复/单值列。
- **统计推断**:statsmodels。回归 `smf.ols("y~x1+x2",data).fit().summary()` 给系数/p/R²/AIC(OLS 用 sm.add_constant 加截距,公式接口自动加);方差分析 `anova_lm(model, typ=2)`;检验在 `statsmodels.stats`(ttest_ind / proportions_ztest / multipletests / het_breuschpagan)。
- **可解释性**:SHAP,见即用脚本 `scripts/explain_shap.py`(一键产 beeswarm/bar/waterfall 三图)。树模型用 `shap.TreeExplainer`(快),通用兜底 `KernelExplainer`(慢,背景集要采样);`shap.plots.beeswarm` 看全局方向、`bar` 看重要性排序、`waterfall` 拆单样本。SHAP 反映模型非因果。
- **静态出版图**:matplotlib 面向对象接口 `fig,ax=plt.subplots(layout="constrained")`,`savefig(dpi=300,bbox_inches="tight")` 存 PDF/SVG 矢量;seaborn 轴级函数(boxplot/heatmap/barplot, barplot 默认带 95%CI 误差棒)可嵌 ax,图形