clinical-eda-reportlisted
Install: claude install-skill JeonKH81/MediStat-EDA
# Clinical EDA Report
의학연구 tabular 데이터(행 = 관찰 단위, 열 = 변수)를 받아, **단일 한국어 HTML 대시보드 리포트**를 생성한다. 연구 디자인(후향/전향 코호트, RCT·임상시험, case-control, cross-sectional, registry 등)이나 관찰 단위(환자·내원·병변·검체 등)에 구애받지 않으며, 행 단위가 무엇인지는 리포트 상단에 함께 명시한다. 결과 리포트는 다음 기능을 갖춘 단일 HTML 파일이다:
- **상단 KPI 카드 6장** — 관찰 수, 변수 수, 전체 결측률, 고결측 변수 수, 이상치 후보 수, VIF≥10 변수 수. 각 카드를 클릭하면 해당 섹션으로 부드럽게 스크롤된다
- **좌측 sticky 사이드바** + **scrollspy** — 현재 보이는 섹션이 자동으로 highlight
- **인터랙티브 SVG 분포 플롯** — 막대 위에 마우스를 올리면 구간/빈도/% 툴팁 표시. Vector 출력이라 확대·인쇄·다크모드 모두 깔끔
- **다크모드 토글** — 헤더 우상단 버튼. `prefers-color-scheme` 자동 감지 + `localStorage` 영속화 (실패 시 graceful fallback)
- **인쇄·PDF 버튼** — 사이드바/컨트롤 자동 숨김, 강제 라이트 모드, 패널 단위 page-break 컨트롤
- **입력 파일의 SHA-256 short hash(12자)** 푸터에 표시 — 같은 파일로 만든 두 리포트의 동일성 검증용
모든 그래프, 폰트, 차트, JS는 base64/인라인으로 임베딩되므로 받는 사람은 파일 하나만 열면 된다 (외부 의존 0).
## 언제 이 스킬을 쓰는가
- 새로 받은 연구 데이터셋(.xlsx/.csv)의 전반적 상태를 빠르게 파악하고 싶을 때 — 후향/전향 코호트, RCT·임상시험, case-control, cross-sectional, registry, survey 등 디자인 무관
- IRB 제출 전·연구계획서 작성 전에 baseline characteristics와 결측 현황을 점검할 때
- 협력기관에서 받은 데이터셋의 품질(이상치, 결측, 코딩 오류)을 검수할 때
- 임상시험 database lock 후·sub-study 시작 전 데이터셋 sanity check
가설검정·생존분석 같은 inferential analysis는 이 스킬의 대상이 아니다. 그쪽은 `survival-analysis` 또는 `clinical-research-harness:stat-analysis`를 안내하라.
**대상이 아닌 데이터**: raw 영상(DICOM, JPEG/PNG 등 이미지 자체), ECG/PPG waveform 시그널, 자연어 임상 기록 free text, 고차원 omics(genome/transcriptome) 매트릭스는 별도 도구가 필요하다. Long-format longitudinal 데이터(환자당 여러 행)는 동작은 하지만 분포·요약통계가 "환자"가 아닌 "관찰 단위(행)" 기준임을 사용자가 인지해야