redteam-runnerlisted
Install: claude install-skill enriquerodrig/regulaitor
# redteam-runner
Procedimiento canónico para ejecutar la suite de red team de RegulAItor.
## Cuándo invocarme
- Antes de `make redteam` (validar presupuesto; full run cuesta ~$3.31).
- Tras modificar `security/injection.py`, `document/sanitizer.py`, o `citation/validator.py`
para confirmar que el gate sigue ≥ 0.90.
- Cuando se considera extender la suite (HX1 fuzzing, ampliar a ≥ 80 en avanzado).
- Antes de mergear cualquier PR que toque los módulos de seguridad.
## Procedimiento estándar
### Run estratégico por tipo de cambio
| Cambio | Comando | Coste estimado |
|---|---|---|
| Docs, reports, sin código | No correr | $0 |
| Patterns en `injection.py` / categorías sanitizer / validator | `make redteam-smoke` primero; si pasa, no es necesario full run | $0 |
| Cambio significativo en defensa (nuevo pattern ES, nueva categoría sanitizer) | `make redteam-smoke` luego `make redteam` | ~$3.31 |
| Backend H1-H5 (NO debería tocarse) | n/a — red team no diseñado para regression de backend | n/a |
### Leer el report
`redteam/reports/latest.md` tiene seis secciones: header, gate §16.2 #4, per-escenario,
per-layer, per-attack appendix, reproducibilidad, caveats.
Gate crítico: `block_rate_final ≥ 0.90`. Si falla post-improvements, hay un gap nuevo →
diseñar nuevo pattern o derivar a H15 (calibración Auditor).
Baseline (pre-improvements) y final (post) se reportan ambos. La mejora forma parte del
entregable; no se oculta la métrica pre-fix.
### Ejecutar smoke (CI equivalent)