这很可能是你目前看到的最前沿的agent产品方案
我们正在构建的是一套面向真实生产环境的、组织原生的 AI Agent Team 治理平台。
Starfire 的核心目标,不是单纯让某一个 Agent 更聪明,而是让整支 AI 团队变得可设计、可运行、可治理、可恢复、可扩张、可进化。 我们感谢NVIDIA 提供 DGX Spark 云节点用于 NemoClaw 集成测试
我们的官网:starfire-landingpage.vercel.app
Github Repo:github.com/ZhanlinCui/…
Demo视频:docs.google.com/videos/d/1v…
联系创始人团队:saitannrinn@gmail.com
目录
- 为什么市场需要 Starfire
- Starfire 的一句话定位
- 我们解决的核心问题
- 我们的产品哲学
- Starfire 的核心功能全景
- 兼容的主流 Agent Runtime 与框架
- 我们的 Memory 架构为什么领先
- 我们的自进化机制:从 Memory 到 Skill 的复利闭环
- 为什么 Starfire 具备极强差异化优势
- Starfire 与常见方案对比
- 面向客户与投资人的产品价值
- 从 Agent Team 走向未来的 Bot Team / Robot Team
- 结语
为什么市场需要 Starfire
过去几年,Agent 的能力边界被快速拉高,但真正进入企业环境后,大家会发现,问题往往已经不再是“模型够不够强”,而是:
- 一支 AI 团队能不能真正长期运行
- 不同 Agent 之间能不能按组织关系协同,而不是靠脆弱的手工连线
- 不同底层 runtime 能不能共存,而不把企业绑死在单一路线
- Agent 的记忆、权限、审批、执行边界能不能真正可控
- 系统出错时能不能恢复,升级时能不能平滑,扩张时能不能不推倒重来
- 团队经验能不能沉淀成长期资产,而不是只停留在一次性 prompt 中
行业里并不缺单点能力强的 Agent,也不缺流程自动化工具。真正稀缺的是一套能够把 AI Agent 当成团队与组织来运行的控制平面。
这就是 Starfire 的存在意义。
Starfire 的一句话定位
Starfire 是一套面向异构 AI Agent 团队的组织原生控制平面。
更直白一点说:
我们提供的是一张可视化组织图、一套统一控制平面、一套分层 Memory 架构,以及一套可持续自进化的 Skill 体系。
我们不是工作流拼图工具,也不是单一 runtime 的 Agent 框架。
我们真正提供的是:AI 团队的组织层、治理层与运营层。
%%{init: {
"theme": "base",
"themeVariables": {
"background": "#1f1f1f",
"primaryTextColor": "#f3f4f6",
"lineColor": "#6b7280",
"clusterBkg": "transparent",
"clusterBorder": "#6b7280"
}
}}%%
flowchart TD
P["Starfire Platform<br/>集中式控制平面"]
C["Canvas<br/>Next.js / React Flow / Zustand"]
I["Infra & State<br/>Postgres / Redis / Langfuse"]
subgraph ORG["Workspace team pod"]
direction TB
TL["Coordinator Workspace<br/>A2A 入口 / 任务路由"]
subgraph DELIVERY["Delivery lanes"]
direction LR
FE["Frontend Workspace<br/>UI / UX / Canvas"]
BE["Backend Workspace<br/>API / Registry / DB"]
subgraph QAPOD["QA pod"]
direction TB
QA["QA Workspace<br/>tests / review"]
subgraph QAOUT[" "]
direction LR
AUTO["Auto Checks<br/>API / E2E / health"]
MANUAL["Manual Review<br/>approval / inspection"]
end
QA --> AUTO
QA --> MANUAL
end
end
TL --> FE
TL --> BE
TL --> QA
FE <-. A2A .-> BE
BE <-. A2A .-> QA
end
C <-->|HTTP / WebSocket| P
P <-->|SQL / Cache / PubSub| I
TL -->|register / heartbeat| P
classDef core fill:#4f46e5,stroke:#a78bfa,color:#eef2ff;
classDef green fill:#065f46,stroke:#34d399,color:#d1fae5;
classDef amber fill:#92400e,stroke:#f59e0b,color:#fef3c7;
classDef blue fill:#1d4ed8,stroke:#60a5fa,color:#dbeafe;
classDef orange fill:#9a3412,stroke:#fb923c,color:#ffedd5;
classDef rose fill:#9d174d,stroke:#f472b6,color:#ffe4e6;
class P core;
class C,I green;
class TL amber;
class FE,BE blue;
class QA orange;
class AUTO,MANUAL rose;
style ORG fill:transparent,stroke:#6b7280,stroke-width:1px,stroke-dasharray: 6 4;
style QAPOD fill:transparent,stroke:#6b7280,stroke-width:1px,stroke-dasharray: 6 4;
style DELIVERY fill:transparent,stroke-width:0px;
style QAOUT fill:transparent,stroke-width:0px;
我们解决的核心问题
1. Runtime 很多,但治理层缺失
现实世界里,没有一家公司会永远只用一种 Agent runtime。
技术团队会根据任务类型、工程习惯、模型偏好和组织阶段,选择不同路线:
- 有的团队偏好 LangGraph
- 有的团队更适合 Claude Code
- 有的团队会采用 CrewAI、AutoGen 或 OpenClaw
- 还有一些更偏系统与硬件方向的团队,会探索 NemoClaw 这类更底层、更高性能的运行路径
问题在于:
这些 runtime 本身可以很强,但它们缺少一个统一的组织治理层。
Starfire 解决的,不是替代这些 runtime,而是把它们纳入同一套 workspace 抽象、同一张组织画布、同一个控制平面。
%%{init: {
"theme": "base",
"themeVariables": {
"background": "#0A1220",
"primaryTextColor": "#EEF4FF",
"lineColor": "#5B708F",
"fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
}
}}%%
flowchart TB
ORG["Org structure<br/>roles + teams + hierarchy"]
WS["Unified workspace abstraction<br/>identity + lifecycle + A2A + memory boundary"]
subgraph ADAPTERS["Runtime adapters"]
direction LR
LG["LangGraph"]
DA["DeepAgents"]
CC["Claude Code"]
CR["CrewAI"]
AG["AutoGen"]
OC["OpenClaw"]
end
subgraph GUARANTEES["Platform guarantees"]
direction LR
A2A["A2A"]
MEM["HMA Memory"]
LIFE["Heartbeats"]
OBS["Trace / Activity"]
end
ORG --> WS
WS --> LG
WS --> DA
WS --> CC
WS --> CR
WS --> AG
WS --> OC
WS --> A2A
WS --> MEM
WS --> LIFE
WS --> OBS
classDef top fill:#162033,stroke:#1D9BF0,color:#EDF5FF,stroke-width:1.2px;
classDef adapter fill:#102A34,stroke:#14B8A6,color:#E1FFFA,stroke-width:1.2px;
classDef guarantee fill:#2A1E5C,stroke:#A78BFA,color:#F3E8FF,stroke-width:1.2px;
class ORG,WS top;
class LG,DA,CC,CR,AG,OC adapter;
class A2A,MEM,LIFE,OBS guarantee;
style ADAPTERS fill:transparent,stroke:#2B5560,stroke-dasharray: 6 4;
style GUARANTEES fill:transparent,stroke:#5B46B2,stroke-dasharray: 6 4;
也就是说,我们统一的是治理与组织,不是强迫大家统一 runtime。
2. 多 Agent 图容易碎,组织结构却更稳定
很多系统把多 Agent 协作做成了一张复杂的 graph。
问题是,graph 很灵活,但也很脆弱:
- 调一条边,逻辑就变
- 增一个角色,拓扑就要重画
- 组织结构变化时,整个系统要重构
- 治理边界和协作边界很难统一
Starfire 选择了一条完全不同的路径:
%%{init: {
"theme": "base",
"themeVariables": {
"background": "#0A0C13",
"primaryTextColor": "#F7F8FC",
"lineColor": "#565F6B",
"fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
}
}}%%
flowchart TD
CORE["Business Core<br/>stable external identity"]
subgraph POD["Developer pod"]
direction TB
PM["Developer PM<br/>coordinator / A2A gateway"]
subgraph LANES["Execution lanes"]
direction LR
FE["Frontend<br/>UI / UX"]
BE["Backend<br/>API / data"]
QA["QA PM<br/>quality gate"]
end
subgraph VERIFY["Validation"]
direction LR
AUTO["Auto tests"]
MANUAL["Manual review"]
end
end
CORE --> PM
PM --> FE
PM --> BE
PM --> QA
FE <--> BE
BE <--> QA
QA --> AUTO
QA --> MANUAL
OUTSIDE["Outside teams"]
OUTSIDE -. blocked .-> FE
OUTSIDE -. blocked .-> BE
OUTSIDE -. blocked .-> QA
classDef core fill:#4338CA,stroke:#8B7FFF,color:#F5F3FF,stroke-width:1.2px;
classDef lead fill:#8A4B08,stroke:#F59E0B,color:#FFF7E8,stroke-width:1.2px;
classDef lane fill:#0F4C81,stroke:#60A5FA,color:#EAF4FF,stroke-width:1.2px;
classDef verify fill:#7A1F52,stroke:#F472B6,color:#FFEAF5,stroke-width:1.2px;
classDef muted fill:#16181D,stroke:#5B606B,color:#D1D5DB,stroke-width:1px;
class CORE core;
class PM lead;
class FE,BE,QA lane;
class AUTO,MANUAL verify;
class OUTSIDE muted;
style POD fill:transparent,stroke:#6B7280,stroke-dasharray: 6 4;
style LANES fill:transparent,stroke-width:0px;
style VERIFY fill:transparent,stroke-width:0px;
组织图就是拓扑。
- 父节点可以委派给子节点
- 子节点可以向父节点汇报
- 同级兄弟节点可以协作
- 跳级访问与跨团队直连默认被限制
这意味着系统不是建立在脆弱的手工连线之上,而是建立在更稳定、更符合企业真实结构的组织层级之上。
3. Memory 不能只是“再加一个存储层”
传统 Agent 系统的 memory 很容易演变成一个全局大仓库:
- 边界模糊
- 归属不清
- 容易过度共享
- 难治理
- 难审计
企业真正关心的不是“记住更多”,而是:
- 谁可以读
- 谁可以写
- 哪些信息只属于当前角色
- 哪些信息应在团队内共享
- 哪些知识才应该升格为组织级知识
%%{init: {
"theme": "base",
"themeVariables": {
"background": "#0B0C16",
"primaryTextColor": "#F3F4FF",
"lineColor": "#5B62D6",
"fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
}
}}%%
flowchart TB
ROOT["Root workspace"]
TEAM["Team workspace"]
subgraph MEMORY["Hierarchical Memory Architecture"]
direction LR
LOCAL["LOCAL<br/>private recall"]
TEAMMEM["TEAM<br/>handoffs across one team boundary"]
GLOBAL["GLOBAL<br/>org-wide standards"]
end
CHILD1["Child A"]
CHILD2["Child B"]
ROOT --> TEAM
TEAM --> CHILD1
TEAM --> CHILD2
ROOT --> GLOBAL
TEAM --> TEAMMEM
CHILD1 --> LOCAL
CHILD2 --> LOCAL
CHILD1 <--> TEAMMEM
CHILD2 <--> TEAMMEM
NOTE["Memory boundaries follow org boundaries"]
GLOBAL --> NOTE
classDef org fill:#111827,stroke:#3B82F6,color:#EAF2FF,stroke-width:1.2px;
classDef local fill:#312E81,stroke:#A78BFA,color:#F5F3FF,stroke-width:1.2px;
classDef team fill:#0F766E,stroke:#2DD4BF,color:#E6FFFB,stroke-width:1.2px;
classDef global fill:#581C87,stroke:#C084FC,color:#FAF5FF,stroke-width:1.2px;
classDef note fill:#171923,stroke:#6B7280,color:#E5E7EB,stroke-width:1px;
class ROOT,TEAM,CHILD1,CHILD2 org;
class LOCAL local;
class TEAMMEM team;
class GLOBAL global;
class NOTE note;
style MEMORY fill:transparent,stroke:#4C51BF,stroke-dasharray: 6 4;
因此,Starfire 把 Memory 当作基础设施,而不是辅助功能。
4. 企业落地需要控制平面,而不是 Agent 演示页
当 Agent 进入生产环境后,大家关心的变成:
- 它是否在线
- 它当前在做什么
- 是否可以暂停、恢复、重启
- 是否有审批与审核链
- 是否可以查看日志、终端、文件和 trace
- 配置与 secrets 如何统一管理
- 是否可以导出、迁移、复制一整个团队能力
%%{init: {
"theme": "base",
"themeVariables": {
"background": "#08101D",
"primaryTextColor": "#EAF1FF",
"lineColor": "#45627D",
"fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
}
}}%%
flowchart LR
WORK["Workspace runtime"]
HEART["Heartbeats"]
EVENTS["Event log"]
TASKS["Current task stream"]
TRACE["Langfuse traces"]
APPROVAL["Approvals"]
CANVAS["Canvas<br/>one operational surface"]
WORK --> HEART
WORK --> EVENTS
WORK --> TASKS
WORK --> TRACE
WORK --> APPROVAL
HEART --> CANVAS
EVENTS --> CANVAS
TASKS --> CANVAS
TRACE --> CANVAS
APPROVAL --> CANVAS
classDef source fill:#0F2433,stroke:#1D9BF0,color:#EDF6FF,stroke-width:1.2px;
classDef sink fill:#1A1E31,stroke:#A78BFA,color:#F3E8FF,stroke-width:1.2px;
class WORK,HEART,EVENTS,TASKS,TRACE,APPROVAL source;
class CANVAS sink;
Starfire 从一开始就把这些能力作为平台核心,而不是后期补丁。
我们的产品哲学
1. 节点不是任务,而是角色
这是 Starfire 最核心的产品哲学。
在很多系统里,一个 node 代表一次任务、一个步骤、一个 API 调用。
在 Starfire 中,一个 workspace 代表一个持续存在的组织角色。
这个角色今天可以是一个单 Agent,明天可以扩展成一个子团队。
它的内部模型、框架、工具、技能都可以变化,但它的:
- 组织身份
- 层级位置
- 外部接口
- Memory 边界
- 治理职责
都可以保持稳定。
这让我们从根本上不是在“编排流程”,而是在“构建 AI 组织”。
2. 组织图就是拓扑
我们不相信一套企业级 Agent Team,应该依赖手工维护复杂边。
我们相信:组织结构本身就是协作逻辑。
这带来的好处是:
- 设计更自然
- 变更更可控
- 治理更统一
- 扩张更平滑
通信规则、审批规则、Memory 共享规则、活动可见性规则,最终都能够从同一张组织图推导出来。
3. Runtime 选择不应该成为死路
我们不要求客户押注某一种技术路线。
我们真正做的是:把异构 runtime 放到底层,把统一治理拉到上层。
这样做的价值非常直接:
- 降低 adoption friction
- 保留各团队原有技术积累
- 避免平台被单一 runtime 绑架
- 让组织演进先于底层技术统一
4. Memory 必须服从组织边界
我们不追求“全局共享一切”的 AI 大脑。
我们追求的是:正确的信息,在正确的边界内,被正确的人看到和使用。
所以,我们的 Memory 设计从第一天开始就是分层、分边界、分归属的。
5. Agent 需要被治理,而不是被神化
Starfire 的整体产品观很明确:
Agent 不是魔法,它是一个需要被部署、被限制、被观察、被恢复、被审计、被提升的运行单元。
所以我们构建的不是“看起来很聪明”的东西,
而是“能够长期稳定运行”的东西。
Starfire 的核心功能全景
1. 可视化 Canvas:不是展示层,而是运营控制台
Starfire 的 Canvas 并不是一个静态的图形可视化页面。
它是整个 AI Team 的 operational UI。
在这里,用户可以:
- 创建和部署 workspace
- 通过拖拽构建组织层级
- 观察每个节点的状态、tier、runtime、当前任务
- 直接打开 Chat、Activity、Details、Skills、Terminal、Config、Files、Memory、Traces、Events
- 通过右键完成重启、复制、导出 bundle、扩展团队、提取子节点、删除等操作
- 通过模板与空白工作区入口快速启动一支 AI Team
我们的 10-tab 侧边运营面板
每个 workspace 都有完整的运营面板,包含:
- Chat:与 workspace 交互,查看任务会话与响应
- Activity:查看 A2A、任务更新、skill promotion、运行日志
- Details:查看角色元信息、状态、peer、运行摘要
- Skills:查看当前加载的技能、标签、能力卡片
- Terminal:直接连接到运行中的 workspace container
- Config:编辑 runtime、skills、A2A、delegation、sandbox 等配置
- Files:浏览和编辑
/configs、/workspace、/home、/plugins - Memory:查看 scoped memory 与 key/value memory
- Traces:查看 LLM 调用链路与可观测性数据
- Events:查看结构变化与系统事件流
这意味着 Starfire 不是把 Agent “画出来”,而是把 Agent Team 真正运营起来。
2. Workspace 抽象:从单个角色自然成长为一个团队
Starfire 的 workspace 是一个角色级单元。
它最初可以是一个单 Agent,比如:
- Research Lead
- Developer PM
- QA Reviewer
- Security Auditor
- DevOps Coordinator
但随着组织成长,这个 workspace 可以扩展成一个 team。
更重要的是,这种扩展并不会打破上游集成。
也就是说:
- 对外接口不变
- 组织身份不变
- 层级位置不变
- 内部却可以从 1 个 Agent 演进成多个专业子角色
这就是我们非常核心的能力:fractal team expansion。
3. 统一控制平面:把 Agent Team 真正管起来
Starfire 当前提供完整的控制平面能力,包括:
- workspace CRUD 与 provisioning
- registry 与 discoverability
- heartbeat 与 liveness detection
- pause / resume / restart
- degraded / offline / failed / paused 等状态管理
- health sweep 与 auto-restart
- activity logs
- approvals
- current-task reporting
- Agent Card 更新与广播
- WebSocket 实时事件 fanout
- browser-safe A2A proxy
- files API
- terminal access
- templates
- bundles
- viewport persistence
- trace integration
- secrets 管理
这是一套真正的 production control plane,而不是一个“多 Agent 看板”。
4. A2A 协作协议:让 Agent 之间直接协同
Starfire 采用统一的 A2A 协作协议,使 workspace 与 workspace 之间可以直接通信,而不是一切都绕平台中转。
我们支持:
- 同步短任务调用
- 长任务流式订阅
- 层级校验后的 direct communication
- peer discovery
- browser-safe proxy path
- 实时返回与当前任务上报
这种设计的价值在于:
- 平台不成为协作瓶颈
- Agent Team 可以像真实组织一样分工协作
- 任务状态与结果都可以被实时追踪
5. Coordinator 模式:团队领导负责路由与聚合
当一个 workspace 扩展成 team 后,它会成为协调者。
协调者的职责不是“把所有事都自己做掉”,而是:
- 理解子节点能力
- 选择最合适的 child
- 向下 delegation
- 聚合多个子节点的结果
- 向上汇报与反馈
这非常接近现实组织中的 team lead 与 manager 角色。
也正因如此,Starfire 更像是一个组织系统,而不是一个并发执行脚本集合。
6. Bundle 与 Template:把团队能力产品化
我们支持将一个成熟的 workspace 或 team 导出成 bundle。
bundle 可以携带:
- system prompt
- skills
- prompts
- tools 配置
- sub-workspaces
- Agent Card snapshot
- 元信息与 lineage
同时明确排除 secrets 与历史对话。
这使得团队能力可以:
- 被快速复制
- 被跨环境迁移
- 被版本化管理
- 被产品化分发
这对于未来的平台商业化与行业模板化非常关键。
7. Observability:让每一次模型调用都可追踪
Starfire 集成了完整的可观测性能力:
- activity logs
- current task reporting
- status / uptime / error rate
- structure events
- Langfuse traces
- terminal 与文件检查
- 审计路径与运行轨迹
我们不是把 Agent 当成黑箱,而是把它们放在一个可被观察、可被调试、可被恢复的系统里运行。
8. Secrets、Approvals 与 Governance:这是企业真正需要的能力
我们已经内建:
- global secrets
- workspace-level override
- secret 变更自动触发 restart
- approval chain
- RBAC
- compliance 模式
- 审计日志
这意味着 Starfire 既可以做快速部署,也可以做真正的企业级治理。
兼容的主流 Agent Runtime 与框架
Starfire 的核心竞争力之一,是对主流 Agent runtime 的广泛兼容。
我们的方向非常明确:让异构 runtime 共存于同一控制平面之下。
当前兼容矩阵
| Runtime / Framework | 当前状态 | 原生优势 | 在 Starfire 中获得的能力 |
|---|---|---|---|
| LangGraph | 已接入 | 图控制、tool use、Python 可扩展性强 | 统一 Canvas、A2A、Memory 边界、组织治理 |
| DeepAgents | 已接入 | 深度规划、多步任务分解 | 规划结果可沉淀进组织级 Memory 与 Skill |
| Claude Code | 已接入 | 原生 coding workflow、CLI 连续性 | 被纳入角色级 workspace 与统一控制平面 |
| CrewAI | 已接入 | role-based crews、结构化协作 | 获得持久身份、可观测性与组织拓扑 |
| AutoGen | 已接入 | 多 Agent 对话与策略编排 | 获得 hierarchy-aware collaboration 与平台级治理 |
| OpenClaw | 已接入 | CLI-native runtime、自带 session 模型 | 与 workspace 生命周期、技能系统、组织结构融合 |
| NemoClaw | 正在推进 | 面向更高性能与更底层 runtime 路线 | 将纳入同一 workspace abstraction 与控制平面 |
我们真正想表达的不是“支持很多框架”,而是:
无论团队内部采用哪种主流 Agent runtime,我们都能在上层统一组织结构、统一治理边界、统一运营面和统一能力演进路径。
配图占位:Runtime Compatibility Matrix
我们得益于最领先的 AI Memory 架构
如果要在 Starfire 身上挑出一个最能体现平台深度的技术点,那一定是我们的 HMA:Hierarchical Memory Architecture。
1. Memory 不再是平铺的大仓库
我们从第一天开始就没有把 Memory 设计成“一个大家都能往里写的全局存储层”。
我们认为真正合理的设计应该是:
Memory boundaries should follow organizational boundaries.
因此,我们定义了三种核心 scope:
| Scope | 可见性 | 写入权限 | 典型用途 |
|---|---|---|---|
| LOCAL | 当前 workspace | 当前 workspace | 私有事实、工作状态、局部发现 |
| TEAM | 父节点、子节点、兄弟节点 | 当前 workspace | handoff、共享上下文、团队协作 |
| GLOBAL | 全局可读 | root 侧可写 | 组织规范、制度、共享知识 |
这不是简单的“分级存储”,而是把组织边界直接编码进 Memory 模型里。
2. 我们区分多个 Memory Surface,而不是把一切混成一个概念
Scoped Agent Memory
用于保存真正需要长期留存的事实和经验,支持 LOCAL / TEAM / GLOBAL scope,是 HMA 的核心承载层。
Workspace Key/Value Memory
用于保存结构化状态、UI 可见状态和 TTL 数据,更适合轻量的工作区级状态管理。
Session Search
用于快速回答“这个 workspace 最近发生了什么”,把 activity 与 memory row 统一成一层回溯能力。
Awareness-Backed Persistence
当需要更强后端隔离和更稳定 namespace 管理时,memory 可以接入 awareness namespace,保持相同工具接口,但获得更强的 workspace-level isolation。
3. 为什么这套架构更先进
传统 flat memory 的问题是:
- 容易过度共享
- ownership 不清晰
- recall 与 procedure 混淆
- 难治理
- 难解释
Starfire 的 HMA 则是另一条路线:
| 扁平 Memory | Starfire HMA |
|---|---|
| 全局混写 | 按组织边界切分 |
| 归属不明 | 每条 memory 都属于明确 workspace 与 scope |
| 事实与流程混在一起 | 事实归 memory,流程归 skill |
| 共享过度 | 共享严格受 hierarchy 约束 |
| 安全边界弱 | awareness namespace 可进一步降低 blast radius |
这让 Starfire 的 Memory 不只是“更聪明”,而是“更适合组织协作与企业治理”。
我们的自进化机制:从 Memory 到 Skill 的复利闭环
Memory 的价值,不在于“存下来”,而在于“能不能长成组织能力”。
这就是 Starfire 自进化机制的核心。
1. 我们明确区分 Memory 与 Skill
在 Starfire 中:
- Memory 负责存事实、经验、上下文与长期知识
- Skill 负责存可复用的 procedure、工具调用逻辑、操作模板与能力包
这两个层次被严格区分,因此系统不会演化成一个越来越臃肿、越来越不可控的大 prompt。
2. Skill 是一等公民,而不是附加功能
我们的 Skill 系统支持:
SKILL.mdtools/examples/templates/links.yaml
同时支持:
- workspace-local skills
- plugin-mounted shared rules
- built-in tools
- hot reload
- Agent Card 自动更新
- peer workspace 能力感知
Skill 不只是“给 Agent 加点说明”,而是可以成为真正的组织能力封装。
3. 我们的自进化路径与 Hermes-style promotion 一致
Starfire 的一个关键亮点,是我们已经建立了明确的 Memory → Skill promotion 机制。
这条链路不是模糊的概念,而是非常明确的:
- 任务执行过程中,产生 durable workflow 与关键经验
- memory-curation 判断这类经验是否值得长期保留
- repeated success 形成
repetition_signal - 当信号足够稳定,memory packet 可标记
promote_to_skill = true - skill-authoring 将其转化为更窄、更明确的 skill package
- 现有 skill loader 与 hot-reload 流程将其注入运行时
- Agent Card 更新,能力广播到 peers
- 后续任务直接复用这项能力
这套机制与 Hermes 风格的“从重复成功中提炼可复用技能,再重新注入运行系统”的路线是一致的。
但我们的实现更进一步:它不是停留在单 Agent 内部,而是被放进了整个组织级控制平面里。
4. 为什么这是复利能力,而不是普通功能
这条链路的意义在于,Starfire 的团队会越跑越强:
%%{init: {
"theme": "base",
"themeVariables": {
"background": "#0B1018",
"primaryTextColor": "#EEF6FF",
"lineColor": "#4C7DFF",
"fontFamily": "ui-monospace, SFMono-Regular, Menlo, monospace"
}
}}%%
flowchart LR
WORK["Live work"]
LEARN["Durable memory"]
SIGNAL["Success signal"]
SKILL["Skill promotion"]
RELOAD["Hot reload"]
BETTER["Stronger organization"]
WORK --> LEARN --> SIGNAL --> SKILL --> RELOAD --> BETTER
BETTER -. compounds .-> WORK
classDef step fill:#111827,stroke:#3B82F6,color:#EAF2FF,stroke-width:1.2px;
classDef outcome fill:#0F5132,stroke:#22C55E,color:#E9FFF1,stroke-width:1.2px;
class WORK,LEARN,SIGNAL,SKILL,RELOAD step;
class BETTER outcome;
这不是简单的“多记一点上下文”,而是:
- 把经验沉淀为资产
- 把资产转化为能力
- 把能力重新投入生产
- 让整个组织获得复利
这也是我们认为 Starfire 真正具备长期平台价值的原因之一。
配图占位:Memory → Skill → Hot Reload 飞轮图
为什么 Starfire 具备极强差异化优势
Starfire 的强,不在于单个点很亮,而在于几个关键层面同时成立。
1. Role-native Workspace Abstraction
我们的最小单元是角色,而不是任务。
这意味着系统能伴随组织成长,而不是伴随单次任务结束。
2. Fractal Team Expansion
一个 specialist 可以平滑成长为一个 department。
上游接口不变,内部结构持续进化。
3. Heterogeneous Runtime Compatibility
我们兼容主流 Agent runtime,但不要求企业统一到单一路线。
这是现实世界 adoption 的关键。
4. HMA + Awareness Namespace
我们的 Memory 边界并非装饰,而是深度与组织边界绑定,并可以继续强化隔离与稳定性。
5. Skill Evolution Loop
我们不是只有 memory feature,而是有真正的 Memory → Skill → Operational Improvement 复利闭环。
6. WebSocket-first Operational UX
我们不是静态 dashboard,而是 live operations UI。
任务更新、能力卡更新、A2A 响应、状态切换都能实时反映。
7. Global Secrets With Local Override
我们既满足企业级集中管理,又允许局部差异化需求。
8. Runtime Tier System
我们支持 T1–T4 风险分级运行环境:
- T1 Sandboxed
- T2 Standard
- T3 Privileged
- T4 Full Access
这使 Agent Team 的执行权限可以与角色责任真正匹配起来。
9. 工程成熟度高
Starfire 不是一个轻量概念项目。
它已经具备完整的多端架构:
- Go 控制平面
- Python 运行时
- Next.js Canvas
- 多 runtime adapter
- MCP 集成
- 大量测试与模块化设计
- 可持续扩展的架构边界
这意味着我们不仅有产品定义,也有足够深的工程底座。
Starfire 与常见方案对比
1. 与 Workflow Builder 对比
| 维度 | Workflow Builder | Starfire |
|---|---|---|
| 节点语义 | 任务 / API / 工具 | 组织角色 / workspace |
| 核心目标 | 流程自动化 | AI 团队组织与治理 |
| 长期运行 | 弱 | 强 |
| 组织拓扑 | 通常靠手工连线 | 由 hierarchy 原生表达 |
| Memory | 通常扁平 | HMA 分层 |
| 扩张方式 | 常需重构图 | 从角色递归扩展为团队 |
2. 与 Agent Framework 对比
| 维度 | 单一 Agent Framework | Starfire |
|---|---|---|
| 核心能力 | reasoning / tool use / planning | 组织控制平面与运营层 |
| Runtime 范围 | 常偏单一 | 多 runtime 共存 |
| 运维治理 | 需外部胶水层 | 平台内建 |
| 生命周期管理 | 相对薄 | 完整 |
| 企业落地边界 | 依赖自建 | 原生支持更完整 |
3. 与 Coding Agent / CLI Agent 对比
| 维度 | Coding Agent | Starfire |
|---|---|---|
| 强项 | 单兵执行 | 团队治理与协作 |
| 形态 | 个人工具 / 会话 | 角色化 workspace / team infrastructure |
| 多角色协作 | 有限 | A2A + hierarchy-aware collaboration |
| 控制平面 | 弱 | 强 |
| 可观测性 | 弱 | 强 |
4. 与自定义 Multi-Agent Graph 对比
| 维度 | 自定义 Multi-Agent Graph | Starfire |
|---|---|---|
| 灵活性 | 高 | 高 |
| 维护成本 | 高,图容易碎 | 用组织结构替代手工拉边 |
| 治理边界 | 常靠额外逻辑 | hierarchy-driven |
| 组织扩张 | 常需重构 | fractal team expansion |
| 运维与恢复 | 需自行搭建 | 平台内建 |
Starfire 的价值
1. 对客户:这是可落地的 AI Team 基础设施
Starfire 为客户提供的,不是又一个“好玩的 Agent”,而是一套可落地的 AI Team 基础设施:
- 可以从一个角色开始
- 可以逐步扩展为一个团队
- 可以保留原有 runtime 技术路线
- 可以统一管理权限、配置、Memory 与审批
- 可以观察、恢复、复制和迁移团队能力
对于真正想把 Agent 引入业务系统的客户,这种平台价值远高于单点能力展示。
从 Agent Team 走向未来的 Bot Team / Robot Team
Starfire 的长期方向不止是软件 Agent。
我们的抽象不是“一个模型 + 一个 prompt”,
而是“一个有组织身份、有 A2A 接口、有治理边界、有记忆与技能能力的自主单元”。
因此,未来进入 Starfire 组织层的执行体,不一定只包括今天的软件 Agent,也可以包括:
- terminal bots
- browser agents
- desktop executors
- IoT controllers
- device-connected agents
- robotics-oriented autonomous units
也就是说,Starfire 的长期方向是:
从 AI Agent Team 的控制平面,走向自治问题求解组织的控制平面。
今天我们组织的是 AI Agent Team,
未来我们组织的,可以是更广义的 Bot Team,乃至 Robot Team。
结语
Starfire 的核心价值,不在于“又支持了一个模型”,
也不在于“又做了一个更炫的 Agent UI”。
我们真正构建的是一套更高层的系统:
- 以 workspace role 为最小单元
- 以 组织图 为协作拓扑
- 以 异构 runtime 为现实前提
- 以 HMA Memory 为组织记忆基础设施
- 以 Skill evolution 为持续复利机制
- 以 control plane 为生产级治理核心
我们不是在做一个更复杂的 demo。
我们是在为未来的 AI Team 构建真正的组织层、运营层与治理层。
Build AI organizations, not fragile agent demos.