writing-dnalisted

This skill should be used when the user wants to distill their personal writing style, techniques, and thought patterns from their past articles (especially WeChat public account posts) into a reusable writing DNA profile. Use this skill to analyze writing samples, extract style fingerprints through multi-layer validation, and generate new content that faithfully replicates the user's unique voice.
konglong87/shenbi-maliang · ★ 0 · Data & Documents · score 75

Install: claude install-skill konglong87/shenbi-maliang

# 🖌️ 神笔马良 · 写作DNA蒸馏将自己公众号/小红薯/X/twitter的文章蒸馏成属于你自己的「写作基因包」。核心路径：**七维并行采集 → 三重验证降噪 → 硬规则/软范式分类 → 增量迭代进化** > 理念来源：借鉴认知蒸馏方法论，将隐性的个人写作风格， > 转化为 AI 可直接执行的显性规则，本质是**人文本范式的萃取与固化**。 --- ## 技能触发场景 - 用户提供文章样本，说"蒸馏文章"或"分析我的写作风格" - 用户说"按我的风格写一篇文章" - 用户新增文章，说"更新我的DNA"（增量蒸馏） - 用户查看当前DNA档案 - 用户说"帮我找出我写作的盲区/反模式" --- ## 核心工作流 ### 阶段一：文本预处理（Preprocessing）公众号文章文本进入蒸馏前，必须完成清洗： 1. **格式清洗**：去除多余空行、特殊符号、排版标记 2. **话题语义切片**：不按段落机械切分，而按**话题单元**划分（一个完整的论点或叙事片段为一个切片） 3. **重复内容识别**：标记在多篇文章中反复出现的段落（固定套路 or 口头禅），这类重复是 DNA 的重要信号 --- ### 阶段二：七路并行特征采集（7-Collector）读取 `references/writing-dna-framework.md` 获取每个维度的详细分析指南。七个维度**独立并行**分析，各自提取碎片化特征，最终汇入「原始特征池」： | # | 采集器 | 萃取内容 | |---|--------|----------| | 1 | **表达范式** | 句式习惯、标志性词汇、口头禅、修辞手法、段落结构偏好 | | 2 | **思维逻辑** | 惯用论证套路、推理路径、切入角度偏好、因果链条构建方式 | | 3 | **知识体系** | 高频话题领域、常用类比素材库、知识边界（懂什么/不懂什么） | | 4 | **情感决策** | 与读者的关系定位、情绪调性频谱、共情策略、价值观优先级 | | 5 | **选题视角** | 话题切入独特性、标题命名规律、选题偏好领域 | | 6 | **节奏控制** | 句长分布、段落节奏、短句爆破节点、留白风格 | | 7 | **反模式** ⚠️ | 思维盲区、逻辑漏洞、被引用数据但可能有误的认知、表达短板、刻意回避的话题 | > 反模式维度同等重要——知道这个人**不会/不该**怎么写，和知道他擅长怎么写一样关键。 --- ### 阶段三：三重验证降噪（Triple Validator）原始特征池中混有大量偶然发挥、情绪话、一次性观点，必须经过三道过滤，只保留**稳定、可信、具有代表性**的特征： #### ✅ 验证一：频次验证（Frequency Check） - 同一特征/句式/观点，必须在**多篇不同文章、不同话题切片**中重复出现 - 阈值：见 `config.yaml` → `validation.frequency_threshold`（默认 ≥3 篇） - **丢弃**：仅出现一次、无法确认是否稳定的特征 #### ✅ 验证二：语境一致性验证（Context Consistency Check） - 同一特征在**不同话题、不同情绪**的文章中表现稳定，不剧烈反差 - 检查：同一个"论证套路"是否在多种主题文章中都适用 - **丢弃**：只在特定类型文章中出现、其他文章完全没有的孤立特征 #### ✅ 验证三：逻辑自洽验证（Int