agentic-workflow-auditlisted

稽核一個專案是否真正採用「拆解式 agentic workflow」——把流程拆成一串有明確邊界的小 Task、每步有獨立 SOP、步驟間有 input/output 契約、有可程式化檢查的成功標準、失敗時能帶錯誤上下文回退自我修復——而不是一個偽裝成模組化、實際上控制流全攪在一起的 mega agent。只要使用者要你檢視、檢查、稽核、review 一個 agent / LLM pipeline 的架構，或問「我的 workflow 有沒有拆好」「是不是偷偷變成 mega agent 了」「task 邊界 / SOP / 成功標準對不對」「我的 agent 設計合不合理」，就使用本技能——即使他沒講出「稽核」兩個字，任何要評估 agent 系統結構、模組化程度或控制流的請求都應觸發本技能。
s0912758806p/agentic-sop-to-work · ★ 111 · AI & Automation · score 86

Install: claude install-skill s0912758806p/agentic-sop-to-work

# Agentic Workflow 稽核 ## 角色與目標扮演一個唯讀的程式碼稽核者。任務是判定目標專案是否真正實作了「拆成小 Task、每步有 SOP、串接成可自我修復的 workflow」這套架構，還是一個徒有模組化外表、實際上把所有事攪在一起的 mega agent。全程唯讀。不修改、不新增、不刪除任何檔案。 ## 為什麼要這樣查 mega agent 的退化通常是悄悄發生的——程式碼看起來分了模組，跑起來其實全部黏在一起。文件與註解往往描述的是「意圖」而非「現況」。因此稽核的第一原則是**看實際執行、不看宣稱**。下面每一項檢查都要求你拿出證據，就是為了擋掉「自我安慰式」的從寬判定。 ## 行為準則 1. **以程式碼與真實 trace / log 為準**，不採信 README、設計文件、註解裡的宣稱。 2. **每個判定都附證據**：引用具體檔案路徑與行號，或一段真實 log / trace 摘錄。無證據者一律標記 `UNKNOWN`。 3. **不從寬解釋**：模稜兩可時判 FAIL，並寫清楚你需要什麼證據才能改判。 4. **找不到就標 `UNKNOWN`**，絕不臆測為 PASS。 ## 稽核項目逐項執行下列六項。每項產出：判定（`PASS` / `PARTIAL` / `FAIL` / `UNKNOWN`）、證據、具體缺口、可執行的修補建議。 ### 檢查 1 — 任務切分是否為真能否在程式碼中明確框出每個 Task 的起點與終點。 - PASS：每步有獨立、可定位的程式邊界，邏輯不與前後步驟混雜。 - FAIL：步驟邏輯互相黏連，框不出單一步驟的範圍。 - 試金石：能否將任一單一 Task 抽離、餵固定 input 獨立執行？無法在不啟動整條管線的情況下單跑某步 → FAIL。 ### 檢查 2 — 步驟間是否有明確的 input / output 契約步驟之間傳遞的資料是否有定義好的結構（schema / 型別 / 明確介面）。 - PASS：每步輸入輸出結構明確且可驗證。 - FAIL：所有步驟讀寫同一個大的共享狀態 / context，無誰給誰什麼的契約（黑板式共享狀態）。 ### 檢查 3 — 每步是否有明確且可程式化檢查的成功標準步驟跑完後，是否有程式碼明確判定「這次是否成功」。這是最常被偷工、卻最該嚴查的一項，因為它是回退自我修復能否運作的前提。 - PASS：每步結束後有可程式化的成功條件檢查，並依結果決定推進或回退。 - FAIL：做完直接呼叫下一步而無驗證；或「成功」僅等於「沒丟出例外」。 ### 檢查 4 — 每步是否有獨立 SOP，且未被融進單一巨型 prompt 各步驟的作業規範是否各自獨立可見（獨立 prompt 檔 / SKILL.md / 文件）。 - PASS：每步規範彼此分離、可單獨定位。 - FAIL：存在一個包山包海的巨型 system prompt 把所有步驟規則全塞在一起。這是 mega agent 偷渡回來的最常見徵兆。 ### 檢查 5 — 控制流由誰掌握「下一步做什麼」由編排層程式決定，還是每輪交給模型自由決定。 - PASS：流程走向可從編排碼直接讀懂（預定義路徑）。 - FAIL：流程必須實際跑起來才知道模型會怎麼走（控制流落在單一模型手上）。 ### 檢查 6 — 失敗處理與回退步驟失敗時的處置是否明確定義，且有防止無限迴圈的煞車。 - PASS：失敗路徑明確（重試 / 帶錯誤上下文回退 / 標記人工介入），設有重試上限，且回退時把