Starfire:全球最强大的 AI Agent Team 治理方案

8 阅读19分钟

这很可能是你目前看到的最前沿的agent产品方案
我们正在构建的是一套面向真实生产环境的、组织原生的 AI Agent Team 治理平台。
Starfire 的核心目标,不是单纯让某一个 Agent 更聪明,而是让整支 AI 团队变得可设计、可运行、可治理、可恢复、可扩张、可进化。 我们感谢NVIDIA 提供 DGX Spark 云节点用于 NemoClaw 集成测试


在这里插入图片描述

我们的官网:starfire-landingpage.vercel.app

Github Repo:github.com/ZhanlinCui/…

Demo视频:docs.google.com/videos/d/1v…

联系创始人团队:saitannrinn@gmail.com

目录


为什么市场需要 Starfire

过去几年,Agent 的能力边界被快速拉高,但真正进入企业环境后,大家会发现,问题往往已经不再是“模型够不够强”,而是:

  • 一支 AI 团队能不能真正长期运行
  • 不同 Agent 之间能不能按组织关系协同,而不是靠脆弱的手工连线
  • 不同底层 runtime 能不能共存,而不把企业绑死在单一路线
  • Agent 的记忆、权限、审批、执行边界能不能真正可控
  • 系统出错时能不能恢复,升级时能不能平滑,扩张时能不能不推倒重来
  • 团队经验能不能沉淀成长期资产,而不是只停留在一次性 prompt 中

行业里并不缺单点能力强的 Agent,也不缺流程自动化工具。真正稀缺的是一套能够把 AI Agent 当成团队与组织来运行的控制平面

5.png 这就是 Starfire 的存在意义。


Starfire 的一句话定位

Starfire 是一套面向异构 AI Agent 团队的组织原生控制平面。

更直白一点说:

我们提供的是一张可视化组织图、一套统一控制平面、一套分层 Memory 架构,以及一套可持续自进化的 Skill 体系。

我们不是工作流拼图工具,也不是单一 runtime 的 Agent 框架。
我们真正提供的是:AI 团队的组织层、治理层与运营层。


%%{init: {
  "theme": "base",
  "themeVariables": {
    "background": "#1f1f1f",
    "primaryTextColor": "#f3f4f6",
    "lineColor": "#6b7280",
    "clusterBkg": "transparent",
    "clusterBorder": "#6b7280"
  }
}}%%
flowchart TD
    P["Starfire Platform<br/>集中式控制平面"]
    C["Canvas<br/>Next.js / React Flow / Zustand"]
    I["Infra & State<br/>Postgres / Redis / Langfuse"]

    subgraph ORG["Workspace team pod"]
        direction TB
        TL["Coordinator Workspace<br/>A2A 入口 / 任务路由"]

        subgraph DELIVERY["Delivery lanes"]
            direction LR
            FE["Frontend Workspace<br/>UI / UX / Canvas"]
            BE["Backend Workspace<br/>API / Registry / DB"]

            subgraph QAPOD["QA pod"]
                direction TB
                QA["QA Workspace<br/>tests / review"]

                subgraph QAOUT[" "]
                    direction LR
                    AUTO["Auto Checks<br/>API / E2E / health"]
                    MANUAL["Manual Review<br/>approval / inspection"]
                end

                QA --> AUTO
                QA --> MANUAL
            end
        end

        TL --> FE
        TL --> BE
        TL --> QA
        FE <-. A2A .-> BE
        BE <-. A2A .-> QA
    end

    C <-->|HTTP / WebSocket| P
    P <-->|SQL / Cache / PubSub| I
    TL -->|register / heartbeat| P

    classDef core fill:#4f46e5,stroke:#a78bfa,color:#eef2ff;
    classDef green fill:#065f46,stroke:#34d399,color:#d1fae5;
    classDef amber fill:#92400e,stroke:#f59e0b,color:#fef3c7;
    classDef blue fill:#1d4ed8,stroke:#60a5fa,color:#dbeafe;
    classDef orange fill:#9a3412,stroke:#fb923c,color:#ffedd5;
    classDef rose fill:#9d174d,stroke:#f472b6,color:#ffe4e6;

    class P core;
    class C,I green;
    class TL amber;
    class FE,BE blue;
    class QA orange;
    class AUTO,MANUAL rose;

    style ORG fill:transparent,stroke:#6b7280,stroke-width:1px,stroke-dasharray: 6 4;
    style QAPOD fill:transparent,stroke:#6b7280,stroke-width:1px,stroke-dasharray: 6 4;
    style DELIVERY fill:transparent,stroke-width:0px;
    style QAOUT fill:transparent,stroke-width:0px;

我们解决的核心问题

1. Runtime 很多,但治理层缺失

现实世界里,没有一家公司会永远只用一种 Agent runtime。
技术团队会根据任务类型、工程习惯、模型偏好和组织阶段,选择不同路线:

  • 有的团队偏好 LangGraph
  • 有的团队更适合 Claude Code
  • 有的团队会采用 CrewAI、AutoGen 或 OpenClaw
  • 还有一些更偏系统与硬件方向的团队,会探索 NemoClaw 这类更底层、更高性能的运行路径

问题在于:
这些 runtime 本身可以很强,但它们缺少一个统一的组织治理层
Starfire 解决的,不是替代这些 runtime,而是把它们纳入同一套 workspace 抽象、同一张组织画布、同一个控制平面。

%%{init: {
  "theme": "base",
  "themeVariables": {
    "background": "#0A1220",
    "primaryTextColor": "#EEF4FF",
    "lineColor": "#5B708F",
    "fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
  }
}}%%
flowchart TB
    ORG["Org structure<br/>roles + teams + hierarchy"]
    WS["Unified workspace abstraction<br/>identity + lifecycle + A2A + memory boundary"]

    subgraph ADAPTERS["Runtime adapters"]
        direction LR
        LG["LangGraph"]
        DA["DeepAgents"]
        CC["Claude Code"]
        CR["CrewAI"]
        AG["AutoGen"]
        OC["OpenClaw"]
    end

    subgraph GUARANTEES["Platform guarantees"]
        direction LR
        A2A["A2A"]
        MEM["HMA Memory"]
        LIFE["Heartbeats"]
        OBS["Trace / Activity"]
    end

    ORG --> WS
    WS --> LG
    WS --> DA
    WS --> CC
    WS --> CR
    WS --> AG
    WS --> OC

    WS --> A2A
    WS --> MEM
    WS --> LIFE
    WS --> OBS

    classDef top fill:#162033,stroke:#1D9BF0,color:#EDF5FF,stroke-width:1.2px;
    classDef adapter fill:#102A34,stroke:#14B8A6,color:#E1FFFA,stroke-width:1.2px;
    classDef guarantee fill:#2A1E5C,stroke:#A78BFA,color:#F3E8FF,stroke-width:1.2px;

    class ORG,WS top;
    class LG,DA,CC,CR,AG,OC adapter;
    class A2A,MEM,LIFE,OBS guarantee;

    style ADAPTERS fill:transparent,stroke:#2B5560,stroke-dasharray: 6 4;
    style GUARANTEES fill:transparent,stroke:#5B46B2,stroke-dasharray: 6 4;

也就是说,我们统一的是治理与组织,不是强迫大家统一 runtime。

2. 多 Agent 图容易碎,组织结构却更稳定

很多系统把多 Agent 协作做成了一张复杂的 graph。
问题是,graph 很灵活,但也很脆弱:

  • 调一条边,逻辑就变
  • 增一个角色,拓扑就要重画
  • 组织结构变化时,整个系统要重构
  • 治理边界和协作边界很难统一

Starfire 选择了一条完全不同的路径:

%%{init: {
  "theme": "base",
  "themeVariables": {
    "background": "#0A0C13",
    "primaryTextColor": "#F7F8FC",
    "lineColor": "#565F6B",
    "fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
  }
}}%%
flowchart TD
    CORE["Business Core<br/>stable external identity"]

    subgraph POD["Developer pod"]
        direction TB
        PM["Developer PM<br/>coordinator / A2A gateway"]

        subgraph LANES["Execution lanes"]
            direction LR
            FE["Frontend<br/>UI / UX"]
            BE["Backend<br/>API / data"]
            QA["QA PM<br/>quality gate"]
        end

        subgraph VERIFY["Validation"]
            direction LR
            AUTO["Auto tests"]
            MANUAL["Manual review"]
        end
    end

    CORE --> PM
    PM --> FE
    PM --> BE
    PM --> QA
    FE <--> BE
    BE <--> QA
    QA --> AUTO
    QA --> MANUAL

    OUTSIDE["Outside teams"]
    OUTSIDE -. blocked .-> FE
    OUTSIDE -. blocked .-> BE
    OUTSIDE -. blocked .-> QA

    classDef core fill:#4338CA,stroke:#8B7FFF,color:#F5F3FF,stroke-width:1.2px;
    classDef lead fill:#8A4B08,stroke:#F59E0B,color:#FFF7E8,stroke-width:1.2px;
    classDef lane fill:#0F4C81,stroke:#60A5FA,color:#EAF4FF,stroke-width:1.2px;
    classDef verify fill:#7A1F52,stroke:#F472B6,color:#FFEAF5,stroke-width:1.2px;
    classDef muted fill:#16181D,stroke:#5B606B,color:#D1D5DB,stroke-width:1px;

    class CORE core;
    class PM lead;
    class FE,BE,QA lane;
    class AUTO,MANUAL verify;
    class OUTSIDE muted;

    style POD fill:transparent,stroke:#6B7280,stroke-dasharray: 6 4;
    style LANES fill:transparent,stroke-width:0px;
    style VERIFY fill:transparent,stroke-width:0px;

组织图就是拓扑。

  • 父节点可以委派给子节点
  • 子节点可以向父节点汇报
  • 同级兄弟节点可以协作
  • 跳级访问与跨团队直连默认被限制

这意味着系统不是建立在脆弱的手工连线之上,而是建立在更稳定、更符合企业真实结构的组织层级之上。

3. Memory 不能只是“再加一个存储层”

传统 Agent 系统的 memory 很容易演变成一个全局大仓库:

  • 边界模糊
  • 归属不清
  • 容易过度共享
  • 难治理
  • 难审计

企业真正关心的不是“记住更多”,而是:

  • 谁可以读
  • 谁可以写
  • 哪些信息只属于当前角色
  • 哪些信息应在团队内共享
  • 哪些知识才应该升格为组织级知识
%%{init: {
  "theme": "base",
  "themeVariables": {
    "background": "#0B0C16",
    "primaryTextColor": "#F3F4FF",
    "lineColor": "#5B62D6",
    "fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
  }
}}%%
flowchart TB
    ROOT["Root workspace"]
    TEAM["Team workspace"]

    subgraph MEMORY["Hierarchical Memory Architecture"]
        direction LR
        LOCAL["LOCAL<br/>private recall"]
        TEAMMEM["TEAM<br/>handoffs across one team boundary"]
        GLOBAL["GLOBAL<br/>org-wide standards"]
    end

    CHILD1["Child A"]
    CHILD2["Child B"]

    ROOT --> TEAM
    TEAM --> CHILD1
    TEAM --> CHILD2

    ROOT --> GLOBAL
    TEAM --> TEAMMEM
    CHILD1 --> LOCAL
    CHILD2 --> LOCAL
    CHILD1 <--> TEAMMEM
    CHILD2 <--> TEAMMEM

    NOTE["Memory boundaries follow org boundaries"]
    GLOBAL --> NOTE

    classDef org fill:#111827,stroke:#3B82F6,color:#EAF2FF,stroke-width:1.2px;
    classDef local fill:#312E81,stroke:#A78BFA,color:#F5F3FF,stroke-width:1.2px;
    classDef team fill:#0F766E,stroke:#2DD4BF,color:#E6FFFB,stroke-width:1.2px;
    classDef global fill:#581C87,stroke:#C084FC,color:#FAF5FF,stroke-width:1.2px;
    classDef note fill:#171923,stroke:#6B7280,color:#E5E7EB,stroke-width:1px;

    class ROOT,TEAM,CHILD1,CHILD2 org;
    class LOCAL local;
    class TEAMMEM team;
    class GLOBAL global;
    class NOTE note;

    style MEMORY fill:transparent,stroke:#4C51BF,stroke-dasharray: 6 4;

因此,Starfire 把 Memory 当作基础设施,而不是辅助功能。

4. 企业落地需要控制平面,而不是 Agent 演示页

当 Agent 进入生产环境后,大家关心的变成:

  • 它是否在线
  • 它当前在做什么
  • 是否可以暂停、恢复、重启
  • 是否有审批与审核链
  • 是否可以查看日志、终端、文件和 trace
  • 配置与 secrets 如何统一管理
  • 是否可以导出、迁移、复制一整个团队能力
%%{init: {
  "theme": "base",
  "themeVariables": {
    "background": "#08101D",
    "primaryTextColor": "#EAF1FF",
    "lineColor": "#45627D",
    "fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
  }
}}%%
flowchart LR
    WORK["Workspace runtime"]
    HEART["Heartbeats"]
    EVENTS["Event log"]
    TASKS["Current task stream"]
    TRACE["Langfuse traces"]
    APPROVAL["Approvals"]
    CANVAS["Canvas<br/>one operational surface"]

    WORK --> HEART
    WORK --> EVENTS
    WORK --> TASKS
    WORK --> TRACE
    WORK --> APPROVAL

    HEART --> CANVAS
    EVENTS --> CANVAS
    TASKS --> CANVAS
    TRACE --> CANVAS
    APPROVAL --> CANVAS

    classDef source fill:#0F2433,stroke:#1D9BF0,color:#EDF6FF,stroke-width:1.2px;
    classDef sink fill:#1A1E31,stroke:#A78BFA,color:#F3E8FF,stroke-width:1.2px;

    class WORK,HEART,EVENTS,TASKS,TRACE,APPROVAL source;
    class CANVAS sink;

Starfire 从一开始就把这些能力作为平台核心,而不是后期补丁。


我们的产品哲学

6.png

1. 节点不是任务,而是角色

这是 Starfire 最核心的产品哲学。

在很多系统里,一个 node 代表一次任务、一个步骤、一个 API 调用。
在 Starfire 中,一个 workspace 代表一个持续存在的组织角色

这个角色今天可以是一个单 Agent,明天可以扩展成一个子团队。
它的内部模型、框架、工具、技能都可以变化,但它的:

  • 组织身份
  • 层级位置
  • 外部接口
  • Memory 边界
  • 治理职责

都可以保持稳定。

这让我们从根本上不是在“编排流程”,而是在“构建 AI 组织”。

2. 组织图就是拓扑

我们不相信一套企业级 Agent Team,应该依赖手工维护复杂边。
我们相信:组织结构本身就是协作逻辑。

这带来的好处是:

  • 设计更自然
  • 变更更可控
  • 治理更统一
  • 扩张更平滑

通信规则、审批规则、Memory 共享规则、活动可见性规则,最终都能够从同一张组织图推导出来。

3. Runtime 选择不应该成为死路

我们不要求客户押注某一种技术路线。
我们真正做的是:把异构 runtime 放到底层,把统一治理拉到上层。

这样做的价值非常直接:

  • 降低 adoption friction
  • 保留各团队原有技术积累
  • 避免平台被单一 runtime 绑架
  • 让组织演进先于底层技术统一

4. Memory 必须服从组织边界

我们不追求“全局共享一切”的 AI 大脑。
我们追求的是:正确的信息,在正确的边界内,被正确的人看到和使用。

所以,我们的 Memory 设计从第一天开始就是分层、分边界、分归属的。

5. Agent 需要被治理,而不是被神化

Starfire 的整体产品观很明确:
Agent 不是魔法,它是一个需要被部署、被限制、被观察、被恢复、被审计、被提升的运行单元。

所以我们构建的不是“看起来很聪明”的东西,
而是“能够长期稳定运行”的东西。


Starfire 的核心功能全景

1. 可视化 Canvas:不是展示层,而是运营控制台

Starfire 的 Canvas 并不是一个静态的图形可视化页面。
它是整个 AI Team 的 operational UI。

在这里,用户可以:

  • 创建和部署 workspace
  • 通过拖拽构建组织层级
  • 观察每个节点的状态、tier、runtime、当前任务
  • 直接打开 Chat、Activity、Details、Skills、Terminal、Config、Files、Memory、Traces、Events
  • 通过右键完成重启、复制、导出 bundle、扩展团队、提取子节点、删除等操作
  • 通过模板与空白工作区入口快速启动一支 AI Team

10.png

我们的 10-tab 侧边运营面板

每个 workspace 都有完整的运营面板,包含:

  • Chat:与 workspace 交互,查看任务会话与响应
  • Activity:查看 A2A、任务更新、skill promotion、运行日志
  • Details:查看角色元信息、状态、peer、运行摘要
  • Skills:查看当前加载的技能、标签、能力卡片
  • Terminal:直接连接到运行中的 workspace container
  • Config:编辑 runtime、skills、A2A、delegation、sandbox 等配置
  • Files:浏览和编辑 /configs/workspace/home/plugins
  • Memory:查看 scoped memory 与 key/value memory
  • Traces:查看 LLM 调用链路与可观测性数据
  • Events:查看结构变化与系统事件流

这意味着 Starfire 不是把 Agent “画出来”,而是把 Agent Team 真正运营起来

2. Workspace 抽象:从单个角色自然成长为一个团队

Starfire 的 workspace 是一个角色级单元。
它最初可以是一个单 Agent,比如:

  • Research Lead
  • Developer PM
  • QA Reviewer
  • Security Auditor
  • DevOps Coordinator

但随着组织成长,这个 workspace 可以扩展成一个 team。
更重要的是,这种扩展并不会打破上游集成。

也就是说:

  • 对外接口不变
  • 组织身份不变
  • 层级位置不变
  • 内部却可以从 1 个 Agent 演进成多个专业子角色

这就是我们非常核心的能力:fractal team expansion

3. 统一控制平面:把 Agent Team 真正管起来

Starfire 当前提供完整的控制平面能力,包括:

  • workspace CRUD 与 provisioning
  • registry 与 discoverability
  • heartbeat 与 liveness detection
  • pause / resume / restart
  • degraded / offline / failed / paused 等状态管理
  • health sweep 与 auto-restart
  • activity logs
  • approvals
  • current-task reporting
  • Agent Card 更新与广播
  • WebSocket 实时事件 fanout
  • browser-safe A2A proxy
  • files API
  • terminal access
  • templates
  • bundles
  • viewport persistence
  • trace integration
  • secrets 管理

8.png

这是一套真正的 production control plane,而不是一个“多 Agent 看板”。

4. A2A 协作协议:让 Agent 之间直接协同

Starfire 采用统一的 A2A 协作协议,使 workspace 与 workspace 之间可以直接通信,而不是一切都绕平台中转。

我们支持:

  • 同步短任务调用
  • 长任务流式订阅
  • 层级校验后的 direct communication
  • peer discovery
  • browser-safe proxy path
  • 实时返回与当前任务上报

这种设计的价值在于:

  • 平台不成为协作瓶颈
  • Agent Team 可以像真实组织一样分工协作
  • 任务状态与结果都可以被实时追踪

5. Coordinator 模式:团队领导负责路由与聚合

当一个 workspace 扩展成 team 后,它会成为协调者。
协调者的职责不是“把所有事都自己做掉”,而是:

  • 理解子节点能力
  • 选择最合适的 child
  • 向下 delegation
  • 聚合多个子节点的结果
  • 向上汇报与反馈

这非常接近现实组织中的 team lead 与 manager 角色。
也正因如此,Starfire 更像是一个组织系统,而不是一个并发执行脚本集合。

6. Bundle 与 Template:把团队能力产品化

我们支持将一个成熟的 workspace 或 team 导出成 bundle。
bundle 可以携带:

  • system prompt
  • skills
  • prompts
  • tools 配置
  • sub-workspaces
  • Agent Card snapshot
  • 元信息与 lineage

同时明确排除 secrets 与历史对话。

这使得团队能力可以:

  • 被快速复制
  • 被跨环境迁移
  • 被版本化管理
  • 被产品化分发

这对于未来的平台商业化与行业模板化非常关键。

7. Observability:让每一次模型调用都可追踪

Starfire 集成了完整的可观测性能力:

  • activity logs
  • current task reporting
  • status / uptime / error rate
  • structure events
  • Langfuse traces
  • terminal 与文件检查
  • 审计路径与运行轨迹

我们不是把 Agent 当成黑箱,而是把它们放在一个可被观察、可被调试、可被恢复的系统里运行。

8. Secrets、Approvals 与 Governance:这是企业真正需要的能力

我们已经内建:

  • global secrets
  • workspace-level override
  • secret 变更自动触发 restart
  • approval chain
  • RBAC
  • compliance 模式
  • 审计日志

这意味着 Starfire 既可以做快速部署,也可以做真正的企业级治理。


兼容的主流 Agent Runtime 与框架

Starfire 的核心竞争力之一,是对主流 Agent runtime 的广泛兼容。
我们的方向非常明确:让异构 runtime 共存于同一控制平面之下。

当前兼容矩阵

Runtime / Framework当前状态原生优势在 Starfire 中获得的能力
LangGraph已接入图控制、tool use、Python 可扩展性强统一 Canvas、A2A、Memory 边界、组织治理
DeepAgents已接入深度规划、多步任务分解规划结果可沉淀进组织级 Memory 与 Skill
Claude Code已接入原生 coding workflow、CLI 连续性被纳入角色级 workspace 与统一控制平面
CrewAI已接入role-based crews、结构化协作获得持久身份、可观测性与组织拓扑
AutoGen已接入多 Agent 对话与策略编排获得 hierarchy-aware collaboration 与平台级治理
OpenClaw已接入CLI-native runtime、自带 session 模型与 workspace 生命周期、技能系统、组织结构融合
NemoClaw正在推进面向更高性能与更底层 runtime 路线将纳入同一 workspace abstraction 与控制平面

我们真正想表达的不是“支持很多框架”,而是:

无论团队内部采用哪种主流 Agent runtime,我们都能在上层统一组织结构、统一治理边界、统一运营面和统一能力演进路径。

配图占位:Runtime Compatibility Matrix


我们得益于最领先的 AI Memory 架构

如果要在 Starfire 身上挑出一个最能体现平台深度的技术点,那一定是我们的 HMA:Hierarchical Memory Architecture

1. Memory 不再是平铺的大仓库

我们从第一天开始就没有把 Memory 设计成“一个大家都能往里写的全局存储层”。
我们认为真正合理的设计应该是:

Memory boundaries should follow organizational boundaries.

因此,我们定义了三种核心 scope:

Scope可见性写入权限典型用途
LOCAL当前 workspace当前 workspace私有事实、工作状态、局部发现
TEAM父节点、子节点、兄弟节点当前 workspacehandoff、共享上下文、团队协作
GLOBAL全局可读root 侧可写组织规范、制度、共享知识

这不是简单的“分级存储”,而是把组织边界直接编码进 Memory 模型里。

2. 我们区分多个 Memory Surface,而不是把一切混成一个概念

Scoped Agent Memory

用于保存真正需要长期留存的事实和经验,支持 LOCAL / TEAM / GLOBAL scope,是 HMA 的核心承载层。

Workspace Key/Value Memory

用于保存结构化状态、UI 可见状态和 TTL 数据,更适合轻量的工作区级状态管理。

Session Search

用于快速回答“这个 workspace 最近发生了什么”,把 activity 与 memory row 统一成一层回溯能力。

Awareness-Backed Persistence

当需要更强后端隔离和更稳定 namespace 管理时,memory 可以接入 awareness namespace,保持相同工具接口,但获得更强的 workspace-level isolation。

3. 为什么这套架构更先进

传统 flat memory 的问题是:

  • 容易过度共享
  • ownership 不清晰
  • recall 与 procedure 混淆
  • 难治理
  • 难解释

Starfire 的 HMA 则是另一条路线:

扁平 MemoryStarfire HMA
全局混写按组织边界切分
归属不明每条 memory 都属于明确 workspace 与 scope
事实与流程混在一起事实归 memory,流程归 skill
共享过度共享严格受 hierarchy 约束
安全边界弱awareness namespace 可进一步降低 blast radius

这让 Starfire 的 Memory 不只是“更聪明”,而是“更适合组织协作与企业治理”。

9.png


我们的自进化机制:从 Memory 到 Skill 的复利闭环

Memory 的价值,不在于“存下来”,而在于“能不能长成组织能力”。

这就是 Starfire 自进化机制的核心。

1. 我们明确区分 Memory 与 Skill

在 Starfire 中:

  • Memory 负责存事实、经验、上下文与长期知识
  • Skill 负责存可复用的 procedure、工具调用逻辑、操作模板与能力包

这两个层次被严格区分,因此系统不会演化成一个越来越臃肿、越来越不可控的大 prompt。

2. Skill 是一等公民,而不是附加功能

我们的 Skill 系统支持:

  • SKILL.md
  • tools/
  • examples/
  • templates/
  • links.yaml

同时支持:

  • workspace-local skills
  • plugin-mounted shared rules
  • built-in tools
  • hot reload
  • Agent Card 自动更新
  • peer workspace 能力感知

Skill 不只是“给 Agent 加点说明”,而是可以成为真正的组织能力封装。

3. 我们的自进化路径与 Hermes-style promotion 一致

Starfire 的一个关键亮点,是我们已经建立了明确的 Memory → Skill promotion 机制。

2.png 这条链路不是模糊的概念,而是非常明确的:

  1. 任务执行过程中,产生 durable workflow 与关键经验
  2. memory-curation 判断这类经验是否值得长期保留
  3. repeated success 形成 repetition_signal
  4. 当信号足够稳定,memory packet 可标记 promote_to_skill = true
  5. skill-authoring 将其转化为更窄、更明确的 skill package
  6. 现有 skill loader 与 hot-reload 流程将其注入运行时
  7. Agent Card 更新,能力广播到 peers
  8. 后续任务直接复用这项能力

这套机制与 Hermes 风格的“从重复成功中提炼可复用技能,再重新注入运行系统”的路线是一致的。
但我们的实现更进一步:它不是停留在单 Agent 内部,而是被放进了整个组织级控制平面里。

4. 为什么这是复利能力,而不是普通功能

这条链路的意义在于,Starfire 的团队会越跑越强:

%%{init: {
  "theme": "base",
  "themeVariables": {
    "background": "#0B1018",
    "primaryTextColor": "#EEF6FF",
    "lineColor": "#4C7DFF",
    "fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
  }
}}%%
flowchart LR
    WORK["Live work"]
    LEARN["Durable memory"]
    SIGNAL["Success signal"]
    SKILL["Skill promotion"]
    RELOAD["Hot reload"]
    BETTER["Stronger organization"]

    WORK --> LEARN --> SIGNAL --> SKILL --> RELOAD --> BETTER
    BETTER -. compounds .-> WORK

    classDef step fill:#111827,stroke:#3B82F6,color:#EAF2FF,stroke-width:1.2px;
    classDef outcome fill:#0F5132,stroke:#22C55E,color:#E9FFF1,stroke-width:1.2px;

    class WORK,LEARN,SIGNAL,SKILL,RELOAD step;
    class BETTER outcome;

这不是简单的“多记一点上下文”,而是:

  • 把经验沉淀为资产
  • 把资产转化为能力
  • 把能力重新投入生产
  • 让整个组织获得复利

这也是我们认为 Starfire 真正具备长期平台价值的原因之一。

配图占位:Memory → Skill → Hot Reload 飞轮图


为什么 Starfire 具备极强差异化优势

11.png

Starfire 的强,不在于单个点很亮,而在于几个关键层面同时成立。

1. Role-native Workspace Abstraction

我们的最小单元是角色,而不是任务。
这意味着系统能伴随组织成长,而不是伴随单次任务结束。

2. Fractal Team Expansion

一个 specialist 可以平滑成长为一个 department。
上游接口不变,内部结构持续进化。

3. Heterogeneous Runtime Compatibility

我们兼容主流 Agent runtime,但不要求企业统一到单一路线。
这是现实世界 adoption 的关键。

4. HMA + Awareness Namespace

我们的 Memory 边界并非装饰,而是深度与组织边界绑定,并可以继续强化隔离与稳定性。

5. Skill Evolution Loop

我们不是只有 memory feature,而是有真正的 Memory → Skill → Operational Improvement 复利闭环。

6. WebSocket-first Operational UX

我们不是静态 dashboard,而是 live operations UI。
任务更新、能力卡更新、A2A 响应、状态切换都能实时反映。

7. Global Secrets With Local Override

我们既满足企业级集中管理,又允许局部差异化需求。

8. Runtime Tier System

我们支持 T1–T4 风险分级运行环境:

  • T1 Sandboxed
  • T2 Standard
  • T3 Privileged
  • T4 Full Access

这使 Agent Team 的执行权限可以与角色责任真正匹配起来。

9. 工程成熟度高

Starfire 不是一个轻量概念项目。
它已经具备完整的多端架构:

  • Go 控制平面
  • Python 运行时
  • Next.js Canvas
  • 多 runtime adapter
  • MCP 集成
  • 大量测试与模块化设计
  • 可持续扩展的架构边界

这意味着我们不仅有产品定义,也有足够深的工程底座。


Starfire 与常见方案对比

1. 与 Workflow Builder 对比

维度Workflow BuilderStarfire
节点语义任务 / API / 工具组织角色 / workspace
核心目标流程自动化AI 团队组织与治理
长期运行
组织拓扑通常靠手工连线由 hierarchy 原生表达
Memory通常扁平HMA 分层
扩张方式常需重构图从角色递归扩展为团队

2. 与 Agent Framework 对比

维度单一 Agent FrameworkStarfire
核心能力reasoning / tool use / planning组织控制平面与运营层
Runtime 范围常偏单一多 runtime 共存
运维治理需外部胶水层平台内建
生命周期管理相对薄完整
企业落地边界依赖自建原生支持更完整

3. 与 Coding Agent / CLI Agent 对比

维度Coding AgentStarfire
强项单兵执行团队治理与协作
形态个人工具 / 会话角色化 workspace / team infrastructure
多角色协作有限A2A + hierarchy-aware collaboration
控制平面
可观测性

4. 与自定义 Multi-Agent Graph 对比

维度自定义 Multi-Agent GraphStarfire
灵活性
维护成本高,图容易碎用组织结构替代手工拉边
治理边界常靠额外逻辑hierarchy-driven
组织扩张常需重构fractal team expansion
运维与恢复需自行搭建平台内建

Starfire 的价值

1. 对客户:这是可落地的 AI Team 基础设施

Starfire 为客户提供的,不是又一个“好玩的 Agent”,而是一套可落地的 AI Team 基础设施:

  • 可以从一个角色开始
  • 可以逐步扩展为一个团队
  • 可以保留原有 runtime 技术路线
  • 可以统一管理权限、配置、Memory 与审批
  • 可以观察、恢复、复制和迁移团队能力

对于真正想把 Agent 引入业务系统的客户,这种平台价值远高于单点能力展示。


从 Agent Team 走向未来的 Bot Team / Robot Team

Starfire 的长期方向不止是软件 Agent。

我们的抽象不是“一个模型 + 一个 prompt”,
而是“一个有组织身份、有 A2A 接口、有治理边界、有记忆与技能能力的自主单元”。

因此,未来进入 Starfire 组织层的执行体,不一定只包括今天的软件 Agent,也可以包括:

  • terminal bots
  • browser agents
  • desktop executors
  • IoT controllers
  • device-connected agents
  • robotics-oriented autonomous units

也就是说,Starfire 的长期方向是:

从 AI Agent Team 的控制平面,走向自治问题求解组织的控制平面。

今天我们组织的是 AI Agent Team,
未来我们组织的,可以是更广义的 Bot Team,乃至 Robot Team。


结语

Starfire 的核心价值,不在于“又支持了一个模型”,
也不在于“又做了一个更炫的 Agent UI”。

我们真正构建的是一套更高层的系统:

  • workspace role 为最小单元
  • 组织图 为协作拓扑
  • 异构 runtime 为现实前提
  • HMA Memory 为组织记忆基础设施
  • Skill evolution 为持续复利机制
  • control plane 为生产级治理核心

我们不是在做一个更复杂的 demo。
我们是在为未来的 AI Team 构建真正的组织层、运营层与治理层。

Build AI organizations, not fragile agent demos.