agent-harness-construction
Solid设计和优化AI代理的动作空间、工具定义和观察格式,以提高完成率。
AI & Automation 201,447 stars
30903 forks Updated yesterday MIT
Install
Quality Score: 92/100
Stars 20%
Recency 20%
Frontmatter 20%
Documentation 15%
Issue Health 10%
License 10%
Description 5%
Skill Content
# 智能体框架构建
当你在改进智能体的规划、调用工具、从错误中恢复以及收敛到完成状态的方式时,使用此技能。
## 核心模型
智能体输出质量受限于:
1. 行动空间质量
2. 观察质量
3. 恢复质量
4. 上下文预算质量
## 行动空间设计
1. 使用稳定、明确的工具名称。
2. 保持输入模式优先且范围狭窄。
3. 返回确定性的输出形状。
4. 除非无法隔离,否则避免使用全能型工具。
## 粒度规则
* 对高风险操作(部署、迁移、权限)使用微工具。
* 对常见的编辑/读取/搜索循环使用中等工具。
* 仅当往返开销是主要成本时使用宏工具。
## 观察设计
每个工具响应都应包括:
* `status`: success|warning|error
* `summary`: 一行结果
* `next_actions`: 可执行的后续步骤
* `artifacts`: 文件路径 / ID
## 错误恢复契约
对于每个错误路径,应包括:
* 根本原因提示
* 安全重试指令
* 明确的停止条件
## 上下文预算管理
1. 保持系统提示词最少且不变。
2. 将大量指导信息移至按需加载的技能中。
3. 优先引用文件,而不是内联长文档。
4. 在阶段边界处进行压缩,而不是任意的令牌阈值。
## 架构模式指导
* ReAct:最适合路径不确定的探索性任务。
* 函数调用:最适合结构化的确定性流程。
* 混合模式(推荐):ReAct 规划 + 类型化工具执行。
## 基准测试
跟踪:
* 完成率
* 每项任务的重试次数
* pass@1 和 pass@3
* 每个成功任务的成本
## 反模式
* 太多语义重叠的工具。
* 不透明的工具输出,没有恢复提示。
* 仅输出错误而没有后续步骤。
* 上下文过载,包含不相关的引用。
Details
- Author
- affaan-m
- Repository
- affaan-m/everything-claude-code
- Created
- 4 months ago
- Last Updated
- yesterday
- Language
- JavaScript
- License
- MIT
Integrates with
Similar Skills
Semantically similar based on skill content — not just same category
AI & Automation Solid
agentic-engineering
作为代理工程师,采用评估优先执行、分解和成本感知模型路由进行操作。
148,923 Updated 1 months ago
affaan-m AI & Automation Listed
agent-harness-construction
Design and optimize AI agent action spaces, tool definitions, and observation formatting for higher completion rates.
0 Updated 2 days ago
goharabbas321 AI & Automation Solid
dispatching-parallel-agents
当面对 2 个以上可以独立进行、无共享状态或顺序依赖的任务时使用
4,380 Updated 1 weeks ago
jnMetaCode AI & Automation Listed
dispatching-parallel-agents
当面对 2 个以上可以独立进行、无共享状态或顺序依赖的任务时使用
0 Updated 4 days ago
xjxj71 AI & Automation Solid
enterprise-agent-ops
通过可观测性、安全边界和生命周期管理来操作长期运行的代理工作负载。
201,447 Updated yesterday
affaan-m