agent-harness-construction

Solid

设计和优化AI代理的动作空间、工具定义和观察格式，以提高完成率。

AI & Automation 201,447 stars 30903 forks Updated yesterday MIT

Install

View on GitHub

Quality Score: 92/100

Stars 20%

100

Recency 20%

100

Frontmatter 20%

Documentation 15%

Issue Health 10%

License 10%

100

Description 5%

100

Skill Content

# 智能体框架构建当你在改进智能体的规划、调用工具、从错误中恢复以及收敛到完成状态的方式时，使用此技能。 ## 核心模型智能体输出质量受限于： 1. 行动空间质量 2. 观察质量 3. 恢复质量 4. 上下文预算质量 ## 行动空间设计 1. 使用稳定、明确的工具名称。 2. 保持输入模式优先且范围狭窄。 3. 返回确定性的输出形状。 4. 除非无法隔离，否则避免使用全能型工具。 ## 粒度规则 * 对高风险操作（部署、迁移、权限）使用微工具。 * 对常见的编辑/读取/搜索循环使用中等工具。 * 仅当往返开销是主要成本时使用宏工具。 ## 观察设计每个工具响应都应包括： * `status`: success|warning|error * `summary`: 一行结果 * `next_actions`: 可执行的后续步骤 * `artifacts`: 文件路径 / ID ## 错误恢复契约对于每个错误路径，应包括： * 根本原因提示 * 安全重试指令 * 明确的停止条件 ## 上下文预算管理 1. 保持系统提示词最少且不变。 2. 将大量指导信息移至按需加载的技能中。 3. 优先引用文件，而不是内联长文档。 4. 在阶段边界处进行压缩，而不是任意的令牌阈值。 ## 架构模式指导 * ReAct：最适合路径不确定的探索性任务。 * 函数调用：最适合结构化的确定性流程。 * 混合模式（推荐）：ReAct 规划 + 类型化工具执行。 ## 基准测试跟踪： * 完成率 * 每项任务的重试次数 * pass@1 和 pass@3 * 每个成功任务的成本 ## 反模式 * 太多语义重叠的工具。 * 不透明的工具输出，没有恢复提示。 * 仅输出错误而没有后续步骤。 * 上下文过载，包含不相关的引用。