scribalisted
Install: claude install-skill AlexanderAbramovPav/scriba
# scriba
Turns any audio/video file into an accurate, speaker-diarized Markdown transcript. Two-pass:
first produce `Speaker 1/2/3` + representative samples, then rename to real people.
## First-run setup — the AI handles it; the user only clicks 3 links and pastes a token
**Before you call `transcribe.sh` for the first time on this machine, check whether `~/.config/scriba/hf_token` exists.** If it does, skip this block. If it doesn't, the user needs a HuggingFace token *before* diarization can work — and they should NOT be left to figure that out alone. Walk them through it conversationally in their language (the chat's language is the user's language; default to English when ambiguous). The flow:
> «Чтобы определить, кто что говорит, нужен бесплатный HuggingFace-токен (~30 секунд):
>
> 1. Открой <https://huggingface.co/join> — заведи аккаунт, если нет.
> 2. Открой <https://huggingface.co/pyannote/segmentation-3.0> и нажми «Agree and access repository» (один клик).
> 3. То же на <https://huggingface.co/pyannote/speaker-diarization-community-1> — это модель, которая распознаёт спикеров (один клик).
> 4. Открой <https://hf.co/settings/tokens> → «+ Create new token» → имя `scriba`, тип **Read**, скопируй сгенерированный токен (вид `hf_...`).
> 5. Вставь его сюда в чат — я сохраню локально с правами 600 и больше никогда не попрошу.»
When the user pastes the token, write it via Bash:
```
mkdir -p ~/.config/scriba && umask 077 && printf '%s\n' '<TOKEN>' > ~/.config/scriba/hf_