writing-dnalisted
Install: claude install-skill konglong87/shenbi-maliang
# 🖌️ 神笔马良 · 写作DNA蒸馏
将自己公众号/小红薯/X/twitter的文章蒸馏成属于你自己的「写作基因包」。
核心路径:**七维并行采集 → 三重验证降噪 → 硬规则/软范式分类 → 增量迭代进化**
> 理念来源:借鉴认知蒸馏方法论,将隐性的个人写作风格,
> 转化为 AI 可直接执行的显性规则,本质是**人文本范式的萃取与固化**。
---
## 技能触发场景
- 用户提供文章样本,说"蒸馏文章"或"分析我的写作风格"
- 用户说"按我的风格写一篇文章"
- 用户新增文章,说"更新我的DNA"(增量蒸馏)
- 用户查看当前DNA档案
- 用户说"帮我找出我写作的盲区/反模式"
---
## 核心工作流
### 阶段一:文本预处理(Preprocessing)
公众号文章文本进入蒸馏前,必须完成清洗:
1. **格式清洗**:去除多余空行、特殊符号、排版标记
2. **话题语义切片**:不按段落机械切分,而按**话题单元**划分(一个完整的论点或叙事片段为一个切片)
3. **重复内容识别**:标记在多篇文章中反复出现的段落(固定套路 or 口头禅),这类重复是 DNA 的重要信号
---
### 阶段二:七路并行特征采集(7-Collector)
读取 `references/writing-dna-framework.md` 获取每个维度的详细分析指南。
七个维度**独立并行**分析,各自提取碎片化特征,最终汇入「原始特征池」:
| # | 采集器 | 萃取内容 |
|---|--------|----------|
| 1 | **表达范式** | 句式习惯、标志性词汇、口头禅、修辞手法、段落结构偏好 |
| 2 | **思维逻辑** | 惯用论证套路、推理路径、切入角度偏好、因果链条构建方式 |
| 3 | **知识体系** | 高频话题领域、常用类比素材库、知识边界(懂什么/不懂什么) |
| 4 | **情感决策** | 与读者的关系定位、情绪调性频谱、共情策略、价值观优先级 |
| 5 | **选题视角** | 话题切入独特性、标题命名规律、选题偏好领域 |
| 6 | **节奏控制** | 句长分布、段落节奏、短句爆破节点、留白风格 |
| 7 | **反模式** ⚠️ | 思维盲区、逻辑漏洞、被引用数据但可能有误的认知、表达短板、刻意回避的话题 |
> 反模式维度同等重要——知道这个人**不会/不该**怎么写,和知道他擅长怎么写一样关键。
---
### 阶段三:三重验证降噪(Triple Validator)
原始特征池中混有大量偶然发挥、情绪话、一次性观点,必须经过三道过滤,
只保留**稳定、可信、具有代表性**的特征:
#### ✅ 验证一:频次验证(Frequency Check)
- 同一特征/句式/观点,必须在**多篇不同文章、不同话题切片**中重复出现
- 阈值:见 `config.yaml` → `validation.frequency_threshold`(默认 ≥3 篇)
- **丢弃**:仅出现一次、无法确认是否稳定的特征
#### ✅ 验证二:语境一致性验证(Context Consistency Check)
- 同一特征在**不同话题、不同情绪**的文章中表现稳定,不剧烈反差
- 检查:同一个"论证套路"是否在多种主题文章中都适用
- **丢弃**:只在特定类型文章中出现、其他文章完全没有的孤立特征
#### ✅ 验证三:逻辑自洽验证(Int