interview-transcription-twlisted
Install: claude install-skill richardvt/claude-skills-journalism-tw
# 台灣採訪錄音轉錄工作流程
逐字稿**不是錄音的文字版,是查核的證據**。本 skill 提供從錄音→轉錄→引語→存檔的台灣場景工作流。
---
## 何時使用
- 訪後將錄音轉為逐字稿
- 從逐字稿提取可發布引語
- 對照查核(原話 vs 報導引述)
- 訪問檔案長期保存
- 多語言訪談(國/台/客/原民族語/英)
- 法律案件之證據錄音轉錄
---
## 一、錄音檔管理
### 命名規範
```
YYYY-MM-DD_受訪者_主題_序號.[副檔名]
範例:2026-05-28_林桂英_麵店拆遷_001.m4a
```
**避免**:用「錄音 001.m4a」「new recording.mp3」這種空泛名稱。
### 多重備份(現場錄完即備)
| 位置 | 用途 |
|---|---|
| 手機 / 錄音筆原檔 | 第一份 |
| 雲端(Google Drive / Dropbox / iCloud) | 第二份 |
| 本機 SSD | 第三份(編輯用) |
| 編輯部 NAS / 共享磁碟 | 第四份(可選,涉公益重大案件) |
### 檔案格式
| 格式 | 何時用 |
|---|---|
| **WAV / FLAC** | 無損,法律案件、長期保存 |
| **M4A (AAC)** | 一般採訪,平衡品質與大小 |
| **MP3 192-320 kbps** | 廣電可用 |
| **不要用 MP3 128 以下** | 品質太差影響轉錄準確度 |
---
## 二、轉錄工具(2026 年台灣可用)
### 開源 / 本地(免費 + 隱私安全)
| 工具 | 語言 | 注意 |
|---|---|---|
| **OpenAI Whisper large-v3** | 中文、英文、台/客/原民族語(基本) | 本地跑;**對台灣口音國語有效**;客語、原民族語效果參差;需 GPU 較流暢 |
| **WhisperX** | 同上 + 含時間軸對齊 + speaker diarization | 適合多人訪談 |
| **Faster-Whisper** | 同上 + 速度更快 | CPU 也可跑 |
| **Whisper.cpp** | 同上 + Mac M 系列優化 | M1/M2/M3/M4 用 GPU 加速 |
### 雲端商用(收費 + 速度快)
| 工具 | 強項 | 注意 |
|---|---|---|
| **OpenAI Whisper API** | 大模型 + 雲端 | 隱私:檔案上傳到 OpenAI |
| **Google Cloud Speech-to-Text** | 多語言 + 客製字典 | 隱私:檔案上傳到 Google |
| **Azure Speech** | 商用穩定 + 多語言 | 隱私:檔案上傳到 Azure |
| **Anthropic Claude API**(間接)| 上傳檔案 + 提示轉錄 | 不是主力轉錄工具 |
### 台灣本地服務
| 服務 | 強項 | 網址 |
|---|---|---|
| **雅婷逐字稿** | 台灣口音、台語(taimedialabs 旗下);**新聞工作者常用** | yating.tw |
| **韻誌語音雲** | 客語、原民族語為強項 | 視專案 |
| **聽錄文字稿(萬芳)** | 人工轉錄,品質高 | 人工服務 |
### 完美組合(2026 實務推薦)
1. **本地 Whis