← ClaudeAtlas

writing-dnalisted

This skill should be used when the user wants to distill their personal writing style, techniques, and thought patterns from their past articles (especially WeChat public account posts) into a reusable writing DNA profile. Use this skill to analyze writing samples, extract style fingerprints through multi-layer validation, and generate new content that faithfully replicates the user's unique voice.
konglong87/shenbi-maliang · ★ 0 · Data & Documents · score 75
Install: claude install-skill konglong87/shenbi-maliang
# 🖌️ 神笔马良 · 写作DNA蒸馏 将自己公众号/小红薯/X/twitter的文章蒸馏成属于你自己的「写作基因包」。 核心路径:**七维并行采集 → 三重验证降噪 → 硬规则/软范式分类 → 增量迭代进化** > 理念来源:借鉴认知蒸馏方法论,将隐性的个人写作风格, > 转化为 AI 可直接执行的显性规则,本质是**人文本范式的萃取与固化**。 --- ## 技能触发场景 - 用户提供文章样本,说"蒸馏文章"或"分析我的写作风格" - 用户说"按我的风格写一篇文章" - 用户新增文章,说"更新我的DNA"(增量蒸馏) - 用户查看当前DNA档案 - 用户说"帮我找出我写作的盲区/反模式" --- ## 核心工作流 ### 阶段一:文本预处理(Preprocessing) 公众号文章文本进入蒸馏前,必须完成清洗: 1. **格式清洗**:去除多余空行、特殊符号、排版标记 2. **话题语义切片**:不按段落机械切分,而按**话题单元**划分(一个完整的论点或叙事片段为一个切片) 3. **重复内容识别**:标记在多篇文章中反复出现的段落(固定套路 or 口头禅),这类重复是 DNA 的重要信号 --- ### 阶段二:七路并行特征采集(7-Collector) 读取 `references/writing-dna-framework.md` 获取每个维度的详细分析指南。 七个维度**独立并行**分析,各自提取碎片化特征,最终汇入「原始特征池」: | # | 采集器 | 萃取内容 | |---|--------|----------| | 1 | **表达范式** | 句式习惯、标志性词汇、口头禅、修辞手法、段落结构偏好 | | 2 | **思维逻辑** | 惯用论证套路、推理路径、切入角度偏好、因果链条构建方式 | | 3 | **知识体系** | 高频话题领域、常用类比素材库、知识边界(懂什么/不懂什么) | | 4 | **情感决策** | 与读者的关系定位、情绪调性频谱、共情策略、价值观优先级 | | 5 | **选题视角** | 话题切入独特性、标题命名规律、选题偏好领域 | | 6 | **节奏控制** | 句长分布、段落节奏、短句爆破节点、留白风格 | | 7 | **反模式** ⚠️ | 思维盲区、逻辑漏洞、被引用数据但可能有误的认知、表达短板、刻意回避的话题 | > 反模式维度同等重要——知道这个人**不会/不该**怎么写,和知道他擅长怎么写一样关键。 --- ### 阶段三:三重验证降噪(Triple Validator) 原始特征池中混有大量偶然发挥、情绪话、一次性观点,必须经过三道过滤, 只保留**稳定、可信、具有代表性**的特征: #### ✅ 验证一:频次验证(Frequency Check) - 同一特征/句式/观点,必须在**多篇不同文章、不同话题切片**中重复出现 - 阈值:见 `config.yaml` → `validation.frequency_threshold`(默认 ≥3 篇) - **丢弃**:仅出现一次、无法确认是否稳定的特征 #### ✅ 验证二:语境一致性验证(Context Consistency Check) - 同一特征在**不同话题、不同情绪**的文章中表现稳定,不剧烈反差 - 检查:同一个"论证套路"是否在多种主题文章中都适用 - **丢弃**:只在特定类型文章中出现、其他文章完全没有的孤立特征 #### ✅ 验证三:逻辑自洽验证(Int