← ClaudeAtlas

text-to-speechlisted

文本转语音工具 - 支持脚本解析、情绪标记和后处理,基于 Edge TTS
frank-syncmarket/skills · ★ 3 · AI & Automation · score 68
Install: claude install-skill frank-syncmarket/skills
# Text-to-Speech Skill 将文本转换为语音,支持播客脚本解析、情绪标记处理和 voice-changer 后处理。 ## 使用说明 当用户请求将文本转换为语音时,使用以下命令: ```bash # 基本用法 python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py <文本文件> # 指定输出文件 python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -o output.mp3 # 指定声音 python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -v zh-CN-XiaoxiaoNeural # 启用后处理(voice-changer) python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --post-process # 列出所有可用声音 python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py --list-voices ``` ## 核心功能 ### 1. 脚本解析 自动识别并移除播客脚本中的注释和标记: - 时间戳:`(00:00)` - BGM 注释:`[BGM渐入:...]` - 舞台指示:`(主播声音:...)` `(停顿 1秒)` - 情绪标记:`(语速放慢,加重语气)` - Markdown 标记:`**文本**` ### 2. 多种声音支持 支持 18+ 种中文声音,包括: - **男声**:YunyangNeural(新闻播音)、YunxiNeural(年轻活力)、YunjianNeural(成熟稳重) - **女声**:XiaoxiaoNeural(温柔亲切)、XiaoyiNeural(活泼开朗)、XiaoyanNeural(新闻播音) ### 3. 语音参数调整 - 语速调整:`--rate "+20%"` 或 `--rate "-10%"` - 音调调整:`--pitch "+5Hz"` 或 `--pitch "-3Hz"` - 音量调整:`--volume "+20%"` 或 `--volume "-10%"` ### 4. 后处理集成 可选集成 voice-changer skill 进行变声处理。 ## 配置文件 配置文件位于:`~/.claude/skills/text-to-speech/config/tts_config.json` ### 主要配置项 ```json { "edge_tts": { "voice": "zh-CN-YunyangNeural", "rate": "+0%", "pitch": "+0Hz", "volume": "+0%" }, "script_parsing": { "enabled": true, "remove_timestamps": true, "remove_bgm_notes": true, "remove_stage_directions": true, "remove_markdow