【Agent Harness】Gliding Horse 设计细节 -- 不跟风开发自己的AI AgentGliding

Gliding Horse Agent OS — 设计细节

摘要：本文深入解析 Gliding Horse Agent OS 的架构设计，涵盖通用化 PDCA 编排、五层记忆架构（受 CPU 缓存启发）、JSON-LD 语义数据总线、5W2H 任务本体、技能图谱自动进化等核心创新。适合 AI 智能体框架开发者、系统架构师及对多智能体协作感兴趣的技术人员阅读。

关键词：Gliding Horse Agent OS AI 智能体框架 PDCA 编排 五层记忆架构 JSON-LD 语义总线 5W2H 任务本体 技能图谱 MESI 缓存一致性 多智能体协作 RDF 知识图谱

1. 通用化 PDCA 编排：超越传统管理

1.1 有何不同？

传统 PDCA（计划-执行-检查-改进）是一种用于流程改进的管理方法论。Gliding Horse Agent OS 实现了通用化计算型 PDCA，它超越了管理范畴，成为一种适应任何复杂度的通用任务执行模型。

graph TB
    subgraph &#34;传统 PDCA&#34;
        T1[&#34;线性循环<br/>人工驱动&#34;]
        T2[&#34;固定阶段&#34;]
        T3[&#34;手动交接&#34;]
    end
    
    subgraph &#34;Gliding Horse 通用化 PDCA&#34;
        G1[&#34;递归循环<br/>智能体自主&#34;]
        G2[&#34;自适应阶段<br/>紧急/探索模式&#34;]
        G3[&#34;事件驱动转换<br/>感知触发&#34;]
        G4[&#34;7 个复杂度级别<br/>L0 即时 → L3 递归&#34;]
    end
    
    T1 -->|演进| G1
    T2 -->|演进| G2
    T3 -->|演进| G3

1.2 七个任务复杂度级别

系统自动将任务分类为 7 个级别，并相应调整 PDCA 循环：

级别	类型	PDCA 适配	示例
L0	即时任务	单轮，无需 PDCA	"现在几点？"
L1	简单任务	单次 PDCA 循环，最小规划	"写一个 Python 脚本"
L2	标准任务	完整 PDCA + 结构化审计	"分析 Q2 销售数据"
L3	复杂项目	多智能体并行 Do 阶段	"构建 REST API + 测试"
L4	探索型任务	多 DA 并行，不同策略	"研究最佳技术栈"
L5	递归任务	子任务生成子 PDCA 循环	"重构整个代码库"
L6	紧急模式	跳过 Plan，立即 Do-Check 循环	"立即修复生产 Bug"

关键创新：Supervisor Agent (SA) 根据 5W2H 元数据分析动态选择合适的 PDCA 模式，而非僵化的模板。这使得同一个编排引擎既能处理简单的查询，也能处理持续数周的工程项目。

1.3 自适应循环模式

stateDiagram-v2
    [*] --> EMERGENCY: 检测到严重故障
    [*] --> EXPLORATORY: 高不确定性
    [*] --> STANDARD: 正常复杂度
    
    EMERGENCY --> DO: 跳过规划
    DO --> CHECK: 立即验证
    CHECK --> ACT: 决策
    ACT --> [*]: 已解决或升级
    
    EXPLORATORY --> PARALLEL_DO: 派生多个 DA
    PARALLEL_DO --> CONVERGE: 比较结果
    CONVERGE --> CHECK: 验证最佳结果
    CHECK --> ACT: 选择策略
    ACT --> [*]
    
    STANDARD --> PLAN: 完整规划
    PLAN --> DO: 顺序执行
    DO --> CHECK: 结构化审计
    CHECK --> ACT: 归档或迭代
    ACT --> [*]

2. 五层记忆架构：CPU 缓存哲学应用于 AI

2.1 受计算机架构启发的革命性设计

与传统智能体框架的扁平上下文窗口不同，Gliding Horse 实现了五层分层记忆系统，直接受 CPU 缓存层级结构（L1/L2/L3 缓存 + RAM + 磁盘存储）启发。

graph TB
    subgraph L1[&#34;L1: 上下文窗口<br/>(~8KB Token 预算)<br/>━━━━━━━━━━━━━━━<br/>速度: 即时<br/>容量: ~20 条摘要 + IRI 指针&#34;]
        L1A[&#34;压缩摘要&#34;]
        L1B[&#34;指向 L2 的 IRI 引用&#34;]
        L1C[&#34;活跃技能片段&#34;]
    end
    
    subgraph L2[&#34;L2: 工作黑板<br/>(Oxigraph 内存 RDF)<br/>━━━━━━━━━━━━━━━<br/>速度: ~2ms 查询<br/>容量: 任务图 + 假设&#34;]
        L2A[&#34;任务树结构&#34;]
        L2B[&#34;中间结果&#34;]
        L2C[&#34;权限矩阵&#34;]
        L2D[&#34;MESI 一致性状态&#34;]
    end
    
    subgraph L3[&#34;L3: 投影引擎<br/>(SPARQL CONSTRUCT + Frame)<br/>━━━━━━━━━━━━━━━<br/>速度: ~15ms 投影<br/>容量: 按需子图&#34;]
        L3A[&#34;8 个预定义框架模板&#34;]
        L3B[&#34;动态 SPARQL 查询&#34;]
        L3C[&#34;物化视图缓存&#34;]
    end
    
    subgraph L0[&#34;L0: 持久存储<br/>(redb KV + HyperspaceEngine)<br/>━━━━━━━━━━━━━━━<br/>速度: ~1ms 读取<br/>容量: 无限（磁盘支持）&#34;]
        L0A[&#34;完整对话历史&#34;]
        L0B[&#34;向量嵌入&#34;]
        L0C[&#34;经验档案&#34;]
        L0D[&#34;技能图谱（完整）&#34;]
    end
    
    L1 <-->|&#34;Token 感知驱逐<br/>语义 LRU&#34;| L2
    L2 <-->|&#34;框架驱动投影<br/>SPARQL CONSTRUCT&#34;| L3
    L3 <-->|&#34;写回策略<br/>批量持久化&#34;| L0

2.2 面向分布式智能体的 MESI 缓存一致性协议

创新：首次将 CPU 缓存一致性协议（MESI：Modified 已修改、Exclusive 独占、Shared 共享、Invalid 无效）应用于多智能体记忆系统。

状态	在智能体上下文中的含义	行为
M（已修改）	节点在 L2 中修改，与 L0 不一致	广播失效到 L1/L3，任务完成时写回
E（独占）	节点加载到 L1，未被共享	快速访问，无一致性开销
S（共享）	节点在多层中缓存，一致	只读共享，适用于读密集型工作负载
I（无效）	引用已过期，必须重新加载	触发"缺页故障"→ 从下层获取

一致性引擎工作流：

DA 修改 L2 黑板中的节点 → 状态变为 M
一致性引擎发送 Invalidate(IRI) 到 L1 → 摘要标记为 I
L3 收到失效通知 → 物化视图移除
下次访问触发从 L0 重新加载更新后的数据

这确保了跨所有智能体实例的强最终一致性，无需昂贵的分布式锁。

2.3 智能预取：扩散激活算法

预取引擎监控智能体意图并主动加载可能需要的知识：

sequenceDiagram
    participant Agent
    participant Prefetch as 预取引擎
    participant L3 as L3 管理器
    participant L0 as L0 存储
    
    Agent->>Prefetch: 检测到意图：&#34;规划旅行&#34;
    Prefetch->>Prefetch: 扩散激活：<br/>旅行 → 航班、酒店、景点
    Prefetch->>L3: 异步 SPARQL 查询相关子图
    L3->>L0: 获取标记为&#34;航班&#34;、&#34;酒店&#34;的记忆
    L0-->>L3: 返回相关块 + 嵌入
    L3-->>Prefetch: 预取子图就绪
    Prefetch->>L2: 加载到预取缓冲区
    Note over L2: 下次访问时命中缓存<br/>延迟: ~2ms vs ~50ms 冷加载

算法：

触发条件：意图切换、实体提及、工具调用返回新链接
扩散：从触发实体出发，在 L3 知识图谱中遍历 1-2 跳
排序：边权重 × 共现频率 → Top-K 实体
执行：异步预加载到 L2"预取区"

结果：知识密集型任务的感知延迟降低 90%。

3. JSON-LD 语义数据总线：通用互操作层

3.1 为什么是 JSON-LD，而不仅仅是 JSON？

大多数智能体框架使用纯 JSON 进行数据交换，导致：

❌ 技能之间的字段名冲突（"input_file" vs "source_url" vs "data_path"）
❌ 缺乏全局实体标识（无法合并来自不同智能体的记忆）
❌ 缺乏语义类型（无法进行多态发现）
❌ 结构固定（无法通过深度控制 Token 预算）

Gliding Horse 使用 JSON-LD 1.1（W3C 标准） 作为通用数据总线，提供六项核心能力：

graph LR
    subgraph &#34;JSON-LD 六大核心特性&#34;
        F1[&#34;@context<br/>字段→IRI 映射&#34;]
        F2[&#34;@id<br/>全局实体 ID&#34;]
        F3[&#34;@type<br/>多类型继承&#34;]
        F4[&#34;嵌套 vs IRI<br/>深度控制&#34;]
        F5[&#34;@graph<br/>命名图&#34;]
        F6[&#34;Frame<br/>形状投影&#34;]
    end
    
    subgraph &#34;架构价值&#34;
        V1[&#34;鸭子类型<br/>零成本集成&#34;]
        V2[&#34;自动合并<br/>跨智能体对齐&#34;]
        V3[&#34;多态发现<br/>SPARQL 匹配&#34;]
        V4[&#34;Token 预算<br/>物理控制&#34;]
        V5[&#34;无冲突并行<br/>精确溯源&#34;]
        V6[&#34;按需投影<br/>上下文经济&#34;]
    end
    
    F1 --> V1
    F2 --> V2
    F3 --> V3
    F4 --> V4
    F5 --> V5
    F6 --> V6

3.2 @context：面向技能的鸭子类型

不同开发者使用不同的参数名编写技能。JSON-LD @context 将所有变体映射到统一的 IRI：

{
  "@context": {
    "skill": "https://agent-harness.os/skill#",
    "skill:inputMapping": {
      "file_path": { "@id": "skill:sourceDataURI" },
      "source_url": { "@id": "skill:sourceDataURI" },
      "data_path": { "@id": "skill:sourceDataURI" }
    }
  }
}

现在 SA 的工具路由器按语义能力（skill:sourceDataURI）匹配技能，而非根据任意的字段名。这是**"协议级别的鸭子类型"**：如果一个技能声明它能处理 skill:sourceDataURI，无论其内部命名如何，它都是兼容的。

3.3 @id：跨智能体实体对齐

当 DA 写入中间结果而 CA 随后审计时，它们引用相同的 @id：

// DA 写入 L2 黑板
{
  "@id": "blackboard:task-001/east-region-result",
  "@type": "exec:TaskResult",
  "exec:growthRate": "35.2",
  "exec:producedBy": { "@id": "agent:da/inst-003" }
}

// CA 通过相同 @id 查询（无需显式传递）
SELECT ?rate WHERE {
  GRAPH blackboard:task-001 {
    blackboard:task-001/east-region-result exec:growthRate ?rate .
  }
}

RDF 处理器自动合并不同图中具有相同 @id 的节点。这实现了无缝的跨智能体记忆融合，无需去重逻辑。

3.4 @type：多态发现

单个节点可以有多种类型，触发不同的系统行为：

{
  "@id": "blackboard:task-001/result",
  "@type": [
    "exec:TaskResult",      // → CA 审计投影匹配此类型
    "exec:NumericalResult", // → CA 选择数值偏差检测技能
    "sec:Auditable",        // → 所有修改记录到审计追踪
    "mon:HighPriority"      // → SA 态势感知标记为红色，缩短检查周期
  ]
}

SPARQL 多态查询：

SELECT ?skill WHERE {
  ?skill a ?skillType .
  FILTER(?skillType IN (skill:NumericalProcessor, skill:TabularProcessor))
}

这实现了多维分类，无需复杂的继承层级。

3.5 嵌套 vs IRI 引用：物理 Token 预算控制

相同的 RDF 图可以表示为完全展开（高 Token 成本）或仅 IRI 指针（最小 Token）：

// 深度展开（适用于活跃子任务，约 1500 tokens）
{
  "@id": "task:sales-analysis",
  "task:subTasks": {
    "@embed": "@always",
    "exec:status": "completed",
    "exec:result": { "value": 35.2 }
  }
}

// 浅引用（适用于历史数据，约 50 tokens）
{
  "@id": "task:sales-analysis",
  "task:relatedHistory": {
    "@embed": "@link",
    "@id": "task:q1-analysis-2025"
  }
}

SA 的智能掐断决策：

活跃子任务 → 深度展开（为智能体提供完整上下文）
历史背景 → 仅 IRI（缺页时加载）
已完成监控 → 摘要投影（仅摘要）

这使得 L1 上下文窗口保持在预算内，同时保持完整的知识可达性。

3.6 @graph 命名图：无冲突并行写入

每个智能体实例拥有自己的命名图，实现无锁并行写入：

graph TB
    subgraph &#34;L0 持久命名图&#34;
        G1[&#34;agent:da/inst-001<br/>DA 私有记忆&#34;]
        G2[&#34;agent:ca/inst-001<br/>CA 私有记忆&#34;]
        G3[&#34;system:knowledge<br/>全局知识库&#34;]
        G4[&#34;system:experience<br/>模式库&#34;]
    end
    
    subgraph &#34;L2 黑板命名图&#34;
        G5[&#34;blackboard:shared<br/>公共区<br/>多智能体读写&#34;]
        G6[&#34;blackboard:task-001<br/>任务 1 私有&#34;]
        G7[&#34;blackboard:prefetch<br/>预取缓冲区&#34;]
    end

访问权限矩阵：

图名称	SA	PA	DA	CA	AA
`blackboard:shared`	读写	读	读写	读写	读
`blackboard:task-{id}`	读写	读	读写	读	读
`agent:{id}`	读	—	—	—	—
`system:audit-log`	读	—	—	—	—

当冲突发生时（DA 说"已完成"，CA 说"失败"），SA 回溯到源图进行仲裁。

3.7 JSON-LD Framing：按需投影

L3 投影引擎使用 Frame 文档声明所需的输出形状：

{
  "@context": { "exec": "https://agent-harness.os/exec#" },
  "@type": "task:AnalysisTask",
  "task:subTasks": {
    "@embed": "@always",           // 完全展开
    "exec:assignedTo": { "@embed": "@link" }  // 仅 IRI
  },
  "task:relatedHistory": {
    "@embed": "@link"              // 历史记录作为指针
  }
}

五级渐进式信息披露：

级别	内容	Token	用户
L1	MOC 索引扫描（名称 + 计数）	~200	SA 初始分析
L2	技能 5W2H 摘要（what/why/when）	~500	SA 技能匹配
L3	链接关系（前置条件）	~800	SA/PA 链式发现
L4	模式 + 步骤列表	~1500	DA 工具调用
L5	完整内容（代码 + 验证）	按需	DA 执行 / CA 审计

这确保每个智能体只看到它需要的、不多也不少。

3.8 简化的 JSON-LD 使用：连接 LLM 与知识图谱

挑战：LLM 不擅长生成复杂的 JSON-LD 结构。它们擅长生成自然语言和简单的 JSON 对象。

我们的解决方案：一种混合方法，利用两种范式的优势：

flowchart TB
    subgraph &#34;LLM 输出（简单 JSON）&#34;
        LLM_OUT[&#34;{<br/>  'think': 'Planning...',<br/>  'content': 'CREATE TABLE...',<br/>  'summary': 'Schema designed'<br/>}&#34;]
    end
    
    subgraph &#34;L2 黑板处理&#34;
        L2BP[&#34;AgentRunner / L2 黑板<br/>━━━━━━━━<br/>1. 按 JSON Schema 验证<br/>2. 转换为 JSON-LD 节点<br/>3. 分配 @id<br/>4. 写入 L2 黑板&#34;]
    end
    
    subgraph &#34;存储层&#34;
        L2_MEM[&#34;L2 Oxigraph 内存<br/>━━━━━━━━<br/>内存 RDF<br/>快速查询 ~2ms&#34;]
        L0_STORE[&#34;L0 持久存储<br/>━━━━━━━━<br/>redb KV + HyperspaceEngine<br/>无限容量&#34;]
    end
    
    LLM_OUT --> HARNESS
    HARNESS --> L2_MEM
    L2_MEM -->|批量写回| L0_STORE

LLM 响应结构（针对多轮对话优化）：

{
  "think": "Analyzing user request for database schema design...",
  "content": "CREATE TABLE users (id UUID PRIMARY KEY, email VARCHAR(255) UNIQUE NOT NULL);",
  "summary": "Database schema for user table with UUID primary key and unique email constraint"
}

为什么采用三字段结构？

字段	用途	Token 效率
think	思维链推理（轮次后丢弃）	临时，不归档
content	完整详细输出（归档至 L0 以追溯）	完整保真度
summary	简洁摘要（保留在 L1 上下文窗口中）	相比完整内容节省约 90% Token

多轮对话优化：

第 1 轮：用户要求设计数据库模式
  → LLM 生成 think/content/summary
  → summary 追加到 L1 上下文（约 50 tokens）
  → content 以 @id: "memory:session-001/block-042" 归档至 L0

第 2 轮：用户问"我们创建了哪些表？"
  → L1 上下文包含摘要："Database schema for user table..."
  → 如需详情，AgentRunner 从 L0 解析 IRI "memory:session-001/block-042"
  → 结果：L1 保持小巧，信息无丢失

AgentRunner 与 L2 黑板的角色：

AgentRunner（通过 L2 黑板）充当了以下两者之间的翻译层：

LLM 的舒适区：包含 think/content/summary 的简单 JSON
系统的需求：包含 @id、@type、@context 的 JSON-LD，用于互操作

处理流程：

// 说明转换过程的伪代码
let llm_output = llm_client.generate(prompt).await?; // 返回简单 JSON

// 步骤 1：按 JSON Schema 验证
validation_engine.validate(&llm_output.content, &skill.input_schema)?;

// 步骤 2：转换为 JSON-LD 节点
let jsonld_node = json!({
    "@id": format!("memory:{}/block-{}", session_id, block_counter),
    "@type": ["mem:MemoryBlock", "exec:TaskResult"],
    "mem:content": llm_output.content,
    "mem:summary": llm_output.summary,
    "mem:embedding": embedding_service.index(&llm_output.content).await?
});

// Step 3: Write to L2 blackboard (Oxigraph in-memory)
l2_manager.insert_node(&jsonld_node)?;

// Step 4: Schedule batch write-back to L0
scheduler.schedule_writeback(session_id, block_counter);

此设计实现了：

✅ 性能：L2 内存查询延迟 ~2ms
✅ 可扩展性：L0 磁盘存储，容量无限
✅ Token 经济性：基于摘要的 L1 上下文，Token 使用最小化
✅ 可追溯性：完整内容保留于 L0，带有 IRI 引用
✅ 互操作性：JSON-LD 支持跨智能体数据共享

4. 5W2H 任务本体：结构化意图建模

4.1 为什么是 5W2H：通用任务本体

所有结构化思维的基础

Gliding Horse Agent OS 建立在两个通用框架之上，它们是处理任何任务的基础：

5W2H（What-做什么、Why-为什么、Who-谁做、When-何时、Where-何地、How-怎么做、How Much-多少资源） — 任务本体
- 回答："到底需要做什么？"
- 目的：明确意图、约束和成功标准
- 时机：在任务初始化阶段应用
PDCA 循环（Plan-计划、Do-执行、Check-检查、Act-改进） — 执行模型
- 回答："我们如何系统地执行和改进？"
- 目的：提供带持续反馈的迭代执行
- 时机：贯穿任务生命周期

graph TB
    subgraph &#34;通用框架（始终必需）&#34;
        U1[&#34;5W2H<br/>━━━━━━━━<br/>任务本体<br/>明确要做什么&#34;]
        U2[&#34;PDCA 循环<br/>━━━━━━━━<br/>执行模型<br/>定义如何执行&#34;]
    end
    
    subgraph &#34;专业模型（技能扩展）&#34;
        S1[&#34;SWOT 分析<br/>战略定位&#34;]
        S2[&#34;5 Whys<br/>根因分析&#34;]
        S3[&#34;SMART 目标<br/>目标细化&#34;]
        S4[&#34;看板<br/>工作流可视化&#34;]
    end
    
    U1 -->|基础| TASK[可执行任务]
    U2 -->|流程| TASK
    S1 -.->|可选技能| TASK
    S2 -.->|可选技能| TASK
    S3 -.->|可选技能| TASK
    S4 -.->|可选技能| TASK
    
    style U1 fill:#e8f5e9,stroke:#2e7d32,stroke-width:3px
    style U2 fill:#e8f5e9,stroke:#2e7d32,stroke-width:3px
    style S1 fill:#fff3e0,stroke:#f57c00,stroke-dasharray: 5 5
    style S2 fill:#fff3e0,stroke:#f57c00,stroke-dasharray: 5 5
    style S3 fill:#fff3e0,stroke:#f57c00,stroke-dasharray: 5 5
    style S4 fill:#fff3e0,stroke:#f57c00,stroke-dasharray: 5 5

为什么两者缺一不可：

任何可执行任务 = 5W2H（意图清晰度）+ PDCA（系统性执行）

框架	角色	缺少它会怎样
5W2H	定义做什么	目标模糊 → 期望偏离
PDCA	定义如何迭代执行	混乱实施 → 缺乏质量控制

完整工作流：

sequenceDiagram
    participant User
    participant SA as SupervisorAgent
    participant PA as PlanAgent
    participant DA as DoAgent
    participant CA as CheckAgent
    participant AA as ActAgent
    
    User->>SA: 提交任务请求
    Note over SA: 步骤 1: 提取 5W2H<br/>(What/Why/Who/When/Where/How/HowMuch)
    
    SA->>PA: 执行 PLAN 阶段
    PA->>PA: 生成微流程 DAG
    PA-->>SA: 返回执行计划
    
    SA->>DA: 执行 DO 阶段
    DA->>DA: 调用工具，写入产物
    DA-->>SA: 返回实施结果
    
    SA->>CA: 执行 CHECK 阶段
    CA->>CA: 按 5W2H 维度审计
    CA-->>SA: 返回审计裁决
    
    SA->>AA: 执行 ACT 阶段
    AA->>AA: 决策：通过/回滚/终止
    AA-->>SA: 最终决定
    
    SA-->>User: 交付结果 + 归档

4.2 超越自由文本提示

传统智能体接受非结构化提示，导致目标模糊和执行不可审计。Gliding Horse 引入 5W2H 任务本体作为所有非平凡任务的标准化元数据框架。

graph TB
    WHAT[&#34;What: 核心目标<br/>━━━━━━━━<br/>创建时必需&#34;] --> WHY
    WHY[&#34;Why: 意图与成功标准<br/>━━━━━━━━<br/>创建时必需<br/>子项: priority, criteria&#34;] --> WHO
    WHY --> WHEN
    WHAT --> HOW
    HOW[&#34;How: 方法与步骤<br/>━━━━━━━━<br/>由 PA 填写<br/>子项: planIRI, skills, dependencies&#34;] --> WHERE
    HOW --> HOWMUCH
    WHO[&#34;Who: 干系人与角色<br/>━━━━━━━━<br/>由 SA/PA 填写<br/>子项: requestor, assignees, requiredRole&#34;] --> HOWMUCH
    WHEN[&#34;When: 时间约束<br/>━━━━━━━━<br/>由 User/SA/PA 填写<br/>子项: deadline, duration, timezone&#34;] --> HOWMUCH
    WHERE[&#34;Where: 数据源与环境<br/>━━━━━━━━<br/>由 PA/DA 填写<br/>子项: repos, branches, env&#34;] --> HOWMUCH
    HOWMUCH[&#34;How Much: 资源预算<br/>━━━━━━━━<br/>由 SA/PA/CA 填写<br/>子项: tokenBudget, maxCycles, quality&#34;]
    
    HOWMUCH -.-> CA_AUDIT[CA 审计依据]
    WHEN -.-> CA_AUDIT
    WHAT -.-> CA_AUDIT
    WHY -.-> CA_AUDIT

4.3 渐进式填充生命周期

每个维度都有一个 fillStage 属性，标记其应在何时填充：

stateDiagram-v2
    CREATE: 任务创建
    PLAN: PA 规划
    DO: DA 执行
    CHECK: CA 审计
    ACT: AA 决策
    DONE: 归档至 L0
    
    CREATE --> PLAN: SA 调度
    PLAN --> DO: PA 输出计划
    DO --> CHECK: DA 完成
    CHECK --> ACT: CA 输出审计
    ACT --> PLAN: 回滚重规划
    ACT --> DONE: 通过
    
    note right of CREATE: 填充 What / Why / 部分 Who & When
    note right of PLAN: 填充 How / Where / 补全 When & Who
    note right of DO: 填充 Where 详情 / 初步 HowMuch
    note right of CHECK: 填充 HowMuch 实际值 / 验证所有维度
    note right of DONE: 冻结完整 5W2H 归档至 L0

示例生命周期：

// 阶段 1：创建（SA 提取最小集）
{
  "@id": "task:sales-q2-analysis",
  "task:5W2H": {
    "what": "分析 Q2 区域销售数据并生成预测报告",
    "why": {
      "description": "为库存规划提供依据",
      "successCriteria": ["输出包含区域增长对比和预测的可视化"],
      "priority": "high"
    },
    "who": { "requestor": "user:vp-sales", "requiredRole": "agent:Do" },
    "when": { "deadline": "2026-05-20T18:00:00+08:00" }
  }
}

// 阶段 2：规划（PA 补全 How/Where）
{
  "task:5W2H": {
    "where": {
      "dataSources": ["file://data/sales_q2.csv", "db://crm/deals"],
      "executionEnvironment": "sandbox"
    },
    "how": {
      "planIRI": "plan:task-tree/sales-q2",
      "preferredSkills": ["skill:python-analysis", "skill:forecasting"],
      "requiredSteps": "1. 数据清洗 → 2. 区域分组 → 3. 预测建模 → 4. 报告生成"
    }
  }
}

// 阶段 3：审计（CA 填充实际 HowMuch）
{
  "task:5W2H": {
    "howMuch": {
      "tokenBudget": 5000,
      "actualCost": 5600,
      "maxPDCACycles": 3,
      "actualCycles": 2
    }
  }
}

4.4 维度级结构化审计

CA 不只说"通过/不通过"。它独立审计每个 5W2H 维度：

{
  "auditBy5W2H": {
    "what": { "verdict": "PASS", "evidence": "已生成包含区域对比和预测的报告" },
    "why": { "verdict": "PASS", "evidence": "结论可直接用于库存规划" },
    "when": { "verdict": "PASS", "evidence": "于 5/19 14:00 交付，在截止日期前" },
    "where": { "verdict": "PASS", "evidence": "数据源匹配，沙箱环境安全" },
    "how": { "verdict": "PASS", "evidence": "全部四个步骤按计划完成" },
    "howMuch": { "verdict": "WARNING", "evidence": "Token 超出 12%，但结果质量高" }
  },
  "overallVerdict": "CONDITIONAL_PASS"
}

然后 AA 做出维度感知的决策：

What/Why 失败 → 回滚至 SA 重新分析
How/Where 失败 → 回滚至 PA 修正计划
When/HowMuch 失败 → 如有理由则通过；否则降级或终止

4.5 模式识别：5W2H 驱动的经验复用

L0 存储所有已完成的任务作为冻结的 task:CompletedTaskSnapshot。SA 的模式识别器官查询类似经验：

PREFIX task: <https://agent-harness.os/task#>

SELECT ?pastTask ?whySimilarity ?howSimilarity
WHERE {
  GRAPH system:experience {
    ?pastTask a task:CompletedTaskSnapshot .
    ?pastTask task:5W2H/task:why ?pastWhy .
    ?pastTask task:5W2H/task:how/task:planIRI ?pastPlan .
    BIND(external:cosineSimilarity(?currentWhyVec, ?pastWhyVec) AS ?whySimilarity)
  }
  FILTER(?whySimilarity > 0.85)
}
ORDER BY DESC(?whySimilarity)
LIMIT 5

匹配的历史 5W2H 子图被注入 SA 决策上下文：

推荐相同的 task:how/preferredSkills
警告历史 task:where 陷阱（如不稳定分支）
提供历史 task:howMuch/actualCost 作为预算参考

5. 技能图谱：具有自动进化能力的认知知识网络

5.1 超越静态技能库

传统智能体框架将技能视为静态函数库。Gliding Horse 实现了动态认知知识网络，其中技能通过使用而进化，积累经验片段，并通过语义链接自组织。

graph TB
    BASE[&#34;skill:Skill<br/>━━━━━━━━<br/>基类，含 5W2H 元数据<br/>+ Schema + Signature&#34;]

    BASE --> ATOMIC[&#34;skill:AtomicSkill<br/>━━━━━━━━<br/>不可分割的原子技能<br/>有明确的入口点&#34;]
    BASE --> COMPOSITE[&#34;skill:CompositeSkill<br/>━━━━━━━━<br/>复合技能<br/>链接到子技能&#34;]
    BASE --> MOC[&#34;skill:MOC<br/>━━━━━━━━<br/>内容地图导航节点<br/>纯导航，无入口点&#34;]
    BASE --> FRAGMENT[&#34;skill:KnowledgeFragment<br/>━━━━━━━━<br/>经验知识片段<br/>附加到特定技能&#34;]
    BASE --> MCP_WRAPPER[&#34;skill:MCPTool<br/>━━━━━━━━<br/>MCP 工具封装<br/>桥接外部 MCP 生态&#34;]

    style BASE fill:#e3f2fd
    style ATOMIC fill:#e8f5e9
    style COMPOSITE fill:#fff3e0
    style MOC fill:#f3e5f5
    style FRAGMENT fill:#ffebee
    style MCP_WRAPPER fill:#e0f2f1

5.2 六种语义链接类型

技能通过六种关系类型连接，每种触发不同的 SA 推理行为：

链接类型	SA 推理行为	示例
`PrerequisiteLink`（前置依赖）	选择 A 时自动包含技能 B	JWT 认证 → 自动加载 Rust 基础
`CompositionLink`（组合）	递归展开子技能 / MOC 导航	MOC 认证域 → 展开 JWT/OAuth2/Token
`RelatedLink`（关联）	完成 A 后推荐 B	完成 JWT 实现 → 建议中间件集成
`AlternativeLink`（替代）	A 不可用时自动切换至 B	Rust 环境不可用 → 切换到 Node.js 版本
`ExtendsLink`（扩展）	基础功能选 A，高级功能选 B	基础 JWT → OAuth2 完整授权
`GeneralizationLink`（泛化）	将特定任务映射到通用模板	销售预测 → 时间序列预测

SPARQL 属性路径递归发现最深 3 层的依赖链：

?target (skill:links/skill:target){0,3} ?chainNode .

5.3 AA 驱动的自动进化

每次任务完成后，AA 分析执行轨迹并进化技能图谱：

flowchart TD
    TASK_DONE[任务完成] --> AA_ANALYZE[AA 分析执行轨迹]

    AA_ANALYZE --> NEW_FAIL{新的<br/>失败模式？}
    NEW_FAIL -->|是| WRITE_FRAG[创建 KnowledgeFragment<br/>附加到对应技能]

    AA_ANALYZE --> NEW_LINK{新的<br/>技能关联？}
    NEW_LINK -->|是| WRITE_LINK[创建 RelatedLink<br/>连接两个技能]

    AA_ANALYZE --> MATURITY{成熟度<br/>需要调整？}
    MATURITY -->|是| UPDATE_MAT[更新 skill:maturity]

    AA_ANALYZE --> STATS{更新统计}
    STATS --> UPDATE_STATS[更新 graphMeta：<br/>usageCount / successRate]

    WRITE_FRAG --> UPDATE_STATS
    WRITE_LINK --> UPDATE_STATS
    UPDATE_MAT --> UPDATE_STATS
    UPDATE_STATS --> DONE[归档至 L0]

示例：CA 发现 JWT 密钥轮换导致大量用户登出。AA 创建一个 KnowledgeFragment：

{
  "@id": "skill:fragment/jwt-key-rotation-pitfall",
  "@type": "skill:KnowledgeFragment",
  "schema:name": "JWT 密钥轮换陷阱",
  "skill:attachedTo": "skill:rust-jwt-auth",
  "skill:content": {
    "problem": "轮换期间直接替换旧密钥会使所有已签发令牌失效",
    "recommendation": "使用 JWKS 端点同时发布多个公钥，实现平滑过渡",
    "alternativeSkill": "skill:jwks-implementation"
  }
}

未来的 SA 在处理 JWT 任务时将看到此片段并推荐 JWKS 方法。

5.4 自引导：/learn 和 /reduce 机制

当 DA 遇到无可利用技能的问题时：

sequenceDiagram
    participant DA
    participant SA
    participant L0
    participant AR as AgentRunner

    DA->>AR: 报告：当前问题无可用技能
    AR->>SA: 通知：需要新技能

    rect rgb(230,240,255)
        Note over SA: /learn 阶段
        SA->>SA: 分析问题特征
        SA->>SA: 生成 5W2H 草案
        SA->>L0: 创建 Skill 节点（状态: draft）
        SA->>L0: 建立与相关 MOC 的链接
    end

    DA->>DA: 继续解决问题（无技能指导）
    DA->>AR: 返回解决方案
    AR->>L0: 记录到临时经验节点

    rect rgb(255,240,230)
        Note over SA: /reduce 阶段
        SA->>L0: 提取解决方案
        SA->>L0: 填充 Skill 内容/步骤
        SA->>L0: 更新状态: active
        SA->>L0: 计算 Ed25519 签名
    end

    SA-->>DA: 新技能已就绪

这实现了无需人工干预的自主技能获取。这实现了无需人工干预的自主技能获取。

下面是一个具体的代码示例，展示当 DA 遇到无可利用技能时，AgentRunner 如何触发 /learn 流程，并生成一个包含 5W2H 元数据的新技能节点 JSON-LD 片段：

// AgentRunner 检测到 DA 报告无可用技能后，触发 /learn 流程
async fn handle_skill_miss(
    agent_runner: &AgentRunner,
    da_report: &DaSkillMissReport,
) -> Result<SkillNode, AgentError> {
    // 步骤 1：SA 分析问题特征，生成 5W2H 草案
    let five_w2h = FiveW2HDraft {
        what: da_report.task_description.clone(),
        why: WhyDraft {
            description: format!(
                "DA 在任务 '{}' 中遇到无可用技能，需自动创建新技能",
                da_report.task_id
            ),
            success_criteria: vec![
                "新技能可处理当前任务".into(),
                "技能元数据完整可复用".into(),
            ],
            priority: Priority::High,
        },
        who: WhoDraft {
            requestor: format!("agent:da/{}", da_report.da_instance_id),
            required_role: "agent:Do".into(),
        },
        when: WhenDraft {
            deadline: Utc::now() + Duration::hours(1),
        },
        how: HowDraft {
            plan_iri: None,
            preferred_skills: vec![],
            required_steps: vec![
                "分析任务特征".into(),
                "生成技能实现".into(),
                "验证技能可用性".into(),
            ],
        },
        where_: WhereDraft {
            data_sources: da_report.context_sources.clone(),
            execution_environment: "sandbox".into(),
        },
        how_much: HowMuchDraft {
            token_budget: 8000,
            max_cycles: 3,
        },
    };

    // 步骤 2：SA 创建 Skill 节点（状态: draft），生成 JSON-LD 片段
    let skill_node = json!({
        "@context": {
            "skill": "https://agent-harness.os/skill#",
            "task": "https://agent-harness.os/task#",
            "schema": "https://schema.org/",
            "xsd": "http://www.w3.org/2001/XMLSchema#"
        },
        "@id": format!("skill:auto/{}", uuid::Uuid::new_v4()),
        "@type": ["skill:AtomicSkill", "skill:AutoGenerated"],
        "schema:name": format!("auto-{}", da_report.task_type),
        "schema:description": format!(
            "由 AgentRunner 自动生成，用于处理 '{}' 类型任务",
            da_report.task_type
        ),
        "skill:status": "draft",
        "skill:createdAt": {
            "@type": "xsd:dateTime",
            "@value": Utc::now().to_rfc3339()
        },
        "skill:5W2H": {
            "task:what": five_w2h.what,
            "task:why": {
                "task:description": five_w2h.why.description,
                "task:successCriteria": five_w2h.why.success_criteria,
                "task:priority": five_w2h.why.priority
            },
            "task:who": {
                "task:requestor": five_w2h.who.requestor,
                "task:requiredRole": five_w2h.who.required_role
            },
            "task:when": {
                "task:deadline": five_w2h.when.deadline.to_rfc3339()
            },
            "task:how": {
                "task:requiredSteps": five_w2h.how.required_steps
            },
            "task:where": {
                "task:dataSources": five_w2h.where_.data_sources,
                "task:executionEnvironment": five_w2h.where_.execution_environment
            },
            "task:howMuch": {
                "task:tokenBudget": five_w2h.how_much.token_budget,
                "task:maxCycles": five_w2h.how_much.max_cycles
            }
        },
        "skill:triggeredBy": {
            "@id": format!("agent:da/{}", da_report.da_instance_id),
            "@type": "agent:DoAgent"
        },
        "skill:sourceTask": {
            "@id": format!("task:{}", da_report.task_id),
            "@type": "task:Task"
        },
        "skill:links": [
            {
                "@type": "skill:RelatedLink",
                "skill:target": {
                    "@id": "moc:auto-generated-skills",
                    "@type": "skill:MOC"
                },
                "skill:relationType": "belongsTo"
            }
        ]
    });

    // 步骤 3：写入 L0 持久存储
    let skill_id = agent_runner
        .l0_manager
        .insert_node(&skill_node)
        .await?;

    // 步骤 4：建立与相关 MOC 的链接
    agent_runner
        .skill_graph
        .add_link(
            &skill_id,
            "moc:auto-generated-skills",
            LinkType::CompositionLink,
        )
        .await?;

    Ok(SkillNode {
        id: skill_id,
        node: skill_node,
        status: SkillStatus::Draft,
    })
}

上述代码展示了 /learn 流程的核心逻辑：

SA 分析问题特征：从 DA 报告中提取任务描述，生成完整的 5W2H 元数据草案
创建 JSON-LD 技能节点：包含 @context、@id、@type、schema:name、skill:5W2H 等字段，其中 5W2H 覆盖了 What/Why/Who/When/How/Where/HowMuch 全部七个维度
持久化与链接：将新技能节点写入 L0 存储，并建立与 moc:auto-generated-skills 的组合链接，使其可被后续任务发现

当 /reduce 阶段 DA 返回解决方案后，SA 会提取该方案填充到技能节点的 skill:content 和 skill:steps 字段，并将状态从 draft 更新为 active，完成完整的自引导闭环。

6. 主动感知引擎：异常检测与智能干预

6.1 十大感知触发器

ProactiveEngine 通过十个不同的触发器监控执行，每个映射到特定的干预计划：

graph TB
    subgraph &#34;10 个感知触发器&#34;
        T1[&#34;TaskStart: 复杂度分析&#34;]
        T2[&#34;PlanCompleted: 子任务限制检查&#34;]
        T3[&#34;ProgressAnomaly: 去重窗口&#34;]
        T4[&#34;CheckCompleted: 基于裁决的告警&#34;]
        T5[&#34;TaskEnd: 经验提取&#34;]
        T6[&#34;CycleTimeout: 耗时监控&#34;]
        T7[&#34;AgentBlocked: 健康检测&#34;]
        T8[&#34;ResourceConflict: 队列/延迟分析&#34;]
        T9[&#34;QualityDegradation: 回滚信号&#34;]
        T10[&#34;UserFeedback: 反馈日志&#34;]
    end
    
    subgraph &#34;干预计划&#34;
        A1[&#34;重新评估当前计划&#34;]
        A2[&#34;重启阻塞的智能体&#34;]
        A3[&#34;调整资源分配&#34;]
        A4[&#34;通知人工监督员&#34;]
    end
    
    T1 & T2 & T3 & T4 & T5 & T6 & T7 & T8 & T9 & T10 -->|&#34;检测到异常&#34;| A1 & A2 & A3 & A4

6.2 异常去重

基于时间窗口的过滤防止告警风暴：

perception:
  anomaly_dedup_window_seconds: 60  # 60 秒内抑制重复告警
  simple_input_threshold: 50         # 输入 < 50 字符 → 简单任务
  medium_input_threshold: 200        # 输入 < 200 字符 → 中等复杂度
  cycle_timeout_secs: 300            # 循环超过 5 分钟则告警
  max_iterations_before_alert: 10    # 10 轮无进展则告警
  error_rate_threshold: 0.5          # 超过 50% 工具调用失败则告警

6.3 5W2H 约束检查

ProactiveEngine 根据 5W2H 约束验证执行：

截止时间违规：当前时间 > task:when/deadline → 升级到人工处理
预算超支：Token 消耗 > task:howMuch/tokenBudget × 0.8 → 警告 SA
角色不匹配：分配的智能体角色 ≠ task:who/requiredRole → 重新分配
环境冲突：两个任务修改同一仓库/分支 → 串行执行

7. 高级工具执行框架

7.1 内置工具（25+）与微工具系统

类别	工具	创新点
文件操作	`file_read`, `file_write`, `file_edit`, `file_list`, `glob_search`, `grep_search`	符号链接检测，路径遍历防护
网络	`WebFetch`, `WebSearch`（DuckDuckGo 回退链）	TLS 强制，代理支持
执行	`Bash`, `PowerShell`（沙箱化 + 超时）	可配置超时，受限路径

微工具创新：对于大型工具结果（>8KB），系统自动生成可对话的微工具：

// 在 file_read 返回 50KB 内容后
微工具: "search_in_results" 
描述: "在之前读取的文件内容中搜索"
参数: { "query": "string", "context_lines": "number" }

这将笨重的输出转变为可交互查询的产物。

7.2 Model Context Protocol (MCP) 集成

通过 MCP 标准集成外部工具服务器：

连接到远程工具提供方（GitHub、Slack、Jira 等）
运行时动态发现工具
带 API 密钥轮换的安全认证

8. 检查点与恢复：容错执行

会话状态持久化支持从崩溃中恢复：

// 在关键点创建检查点
let checkpoint_id = checkpoint_manager.create(
    &task_iri,
    &format!("cycle:{}", cycle_id),
    &state_json,
    &metadata_json,
    &context_json,
    &artifacts
)?;

// 崩溃后恢复
let restored_state = checkpoint_manager.restore(&task_iri)?;

使用场景：

长时间运行的任务恢复（数小时/数天）
智能体重启而不丢失上下文
事后分析和回放调试

9. 工作任务队列：后台作业处理

用于异步操作的持久化队列：

技术：yaque（Yet Another Queue）+ bincode 序列化
特性：磁盘持久化、确认确认、窥视操作
使用场景：
- 批量知识导入（数千文档）
- 定时技能进化（夜间优化）
- 定期清理（过期缓存条目）
- 异步嵌入生成

10. 模板引擎与 JSON Schema 验证

10.1 基于 Markdown 的提示模板

## 角色: {{agent_role}}
## 任务: {{task_description}}

### 上下文
{{l3_projection}}

### 可用技能
{{skill_list}}

### 5W2H 约束
- What: {{what}}
- Why: {{why}}
- When: {{deadline}}
- How Much: {{token_budget}}

### 指令
...

特性：

递归目录扫描
变量插值（{placeholder} 语法）
模板继承（通过 include）
版本控制于 Git 中

10.2 一次往返，双重收获

高级验证模式，在单次 LLM 调用中同时提取元数据并转换为 JSON-LD：

// LLM 输出
{
  "thought": "正在规划数据库模式...",
  "content": "CREATE TABLE users...",
  "summary": "数据库模式设计完成",
  "metadata": {
    "tables": ["users", "orders"],
    "relationships": ["one-to-many"]
  }
}

// 系统处理：
// 1. 按 JSON Schema 验证 metadata
// 2. 将验证后的 metadata 转换为 JSON-LD 节点
// 3. 以 @id 写入 L2 黑板
// 结果：单次 LLM 调用 → 验证后的结构化数据 + 自然语言

这使信息提取效率比传统单一用途提示提高一倍。

11. 架构

11.1 系统组件

graph TB
    subgraph Client[&#34;客户端应用&#34;]
        PY[&#34;Python 编排器&#34;]
        TS[&#34;TypeScript 前端&#34;]
        GO[&#34;Go 服务&#34;]
    end
    
    subgraph API[&#34;API 层&#34;]
        GRPC[&#34;gRPC 服务器<br/>tonic [::1]:50051&#34;]
        HTTP[&#34;HTTP Edge 守护进程<br/>axum :8080&#34;]
    end
    
    subgraph Core[&#34;核心协调&#34;]
        SA[&#34;SupervisorAgent<br/>PDCA 编排&#34;]
        AR[&#34;AgentRunner<br/>ReAct 循环&#34;]
        BA[&#34;BizAgent<br/>隔离执行&#34;]
        EB[&#34;EventBus<br/>异步分发&#34;]
        CP[&#34;Checkpoint<br/>状态持久化&#34;]
        SG[&#34;SyscallGate<br/>权限控制&#34;]
    end
    
    subgraph Memory[&#34;记忆系统&#34;]
        L0[&#34;L0: redb + HyperspaceEngine<br/>持久 KV + 向量&#34;]
        L1[&#34;L1: Session<br/>每智能体对话&#34;]
        L2[&#34;L2: Oxigraph<br/>共享黑板 + RDF&#34;]
        L3[&#34;L3: SPARQL CONSTRUCT<br/>投影引擎&#34;]
        MM[&#34;MemoryManager<br/>跨层协调&#34;]
    end
    
    subgraph Tools[&#34;工具系统&#34;]
        TE[&#34;ToolExecutor<br/>25+ 内置工具&#34;]
        SR[&#34;SkillRegistry<br/>技能目录&#34;]
        MCP[&#34;MCP Client<br/>外部工具&#34;]
        KG[&#34;知识图谱工具<br/>代码 AST、RDF、桥接&#34;]
    end
    
    subgraph Infra[&#34;基础设施&#34;]
        TMPL[&#34;TemplateEngine<br/>提示模板&#34;]
        LLM[&#34;LLMClient<br/>OpenAI 兼容&#34;]
        PE[&#34;ProactiveEngine<br/>异常检测&#34;]
        JL[&#34;JSON-LD Framing<br/>上下文投影&#34;]
        SKG[&#34;Skill Graph<br/>15 个模块&#34;]
        WQ[&#34;Worker TaskQueue<br/>yaque + bincode&#34;]
    end
    
    Client --> GRPC
    Client --> HTTP
    GRPC --> Core
    HTTP --> Core
    Core --> Memory
    Core --> Tools
    Core --> Infra
    Tools --> Memory

11.2 数据流：现代流马在行动

sequenceDiagram
    participant User
    participant SA as SupervisorAgent<br/>(战略家)
    participant PA as PlanAgent<br/>(导航员)
    participant DA as DoAgent<br/>(搬运工)
    participant L2 as L2 黑板<br/>(补给路线)
    participant L0 as L0 存储<br/>(档案馆)
    participant TE as ToolExecutor<br/>(机关)
    
    User->>SA: 提交任务（&#34;构建一个 REST API&#34;）
    Note over SA: 如同诸葛亮规划<br/>北伐
    SA->>SA: 分析复杂度（5W2H）
    SA->>PA: 执行规划阶段
    PA->>L2: 写入执行计划（RDF 节点）
    PA-->>SA: 返回战略路线图
    SA->>DA: 按计划执行
    Note over DA: 如同流马<br/>负重上山
    DA->>TE: 调用工具（file_write, bash）
    TE->>L2: 自动图谱化结果 → RDF
    DA->>L2: 写入代码产物
    DA-->>SA: 返回实施结果
    SA->>L0: 归档任务摘要
    Note over L0: 为未来的远征<br/>保存智慧
    SA-->>User: 交付最终结果

本文档聚焦于 Gliding Horse Agent OS 的架构设计和系统创新。有关快速入门指南、应用展示和项目概述，请参阅 README.md 或 README.zh.md。