困境
在即将过去的互联网时代,我们早已习惯用“人类的方式”与世界互动:注册、点击、搜索、确认,等待响应。即使在 AI 技术日益成熟的今天,人机交互的主流方式依然停留在自然语言输入框中——仿佛我们把一个潜在的超级智能,困在了一个窄小的监狱里,只能通过有限的窗口传递 指令。
这难道不令人困惑吗?今天的无数 AI 创业公司仍在投入资源优化 Chat UI,仿佛把对话框做得更丝滑,就能迎来下一代交互 范式。但这真的是我们此刻所能达到的极限吗?
大模型已经拥有理解复杂意图的能力,然而我们却没有给它们一个真正“行动”的空间。在交互模式上,我们依然沿用着一个根本性的前提:这个数字世界是为人而设计的。网页、按钮、输入框……这些交互机制都默认人类是流程的发起者与执行者。
但如果我们开始认真思考一个以 AI 为主体的世界,一个 agent 能够协同、决策、执行的世界,那么这些传统形式便显得多余,甚至成为束缚。
AI 不应只是人在屏幕前的“替身” ,而是一个拥有独立执行力的数字行动者。它所需要的,不是更精致的界面,而是一个为其量身打造的通信协议。正如 TCP/IP 曾为计算机之间的连接奠定基础,我们如今也需要一种“执行层协议”来支撑 agent 与 agent、agent 与服务、agent 与人之间的协作与交换。
很多人谈到 agent 的未来时,总会描绘出一个“超级助手”的形象——类似 J.A.R.V.I.S,你说一句话,它就能帮你完成所有事情。但真正的挑战,从来不是“听懂人类说的话”,而是如何在真实世界中拆解目标、组织资源、协调合作并最终落地执行。
举个再日常不过的例子:你说“我想周末去运动一下”。模型理解这句话并不难,难的是之后的一连串操作:去哪?和谁?选哪个场地?价格是否合适?是否能试课?有没有更好的时间?这些看似琐碎但实际构成“行动”的环节,今天仍然由人类手动处理。
一个真正理想的 agent,不应该停留在对话框中为你提供建议,而应主动代表你发起请求,找到可选服务,与它们交谈、比价、协调时间与条件,最终将一两个高质量的选项呈现在你面前。你只需做选择,其余的事务代理交给 agent 完成。
我们如今面临的瓶颈,不在于模型是否足够聪明,而在于 agent 缺乏一套“能动起来”的基础设施。不是缺少更强的推荐算法,而是缺少从意图到执行的完整通路。
要让这一切真正成为可能,我们必须先迈出一小步,但也是最关键的一步:定义一套属于 AI 时代的协议栈。
这个协议栈不仅仅是“通信格式”或“接口标准”,它要能够完整表达并传递以下信息:
- 谁发起了意图
- 谁具备哪些能力
- 这些能力如何被组合、调度与协作
- 权限如何划分,责任如何归属
- 数据在执行过程中如何流动、隔离与保护
这不仅是一个技术问题,更是一种新的协作范式的基础设施。因为我们正在构建的,不是一个“更聪明的网页”,而是一个可以彼此理解、互相协作的 agent 网络。
最重要的是,这个协议栈不能是封闭的。今天市面上大多数所谓的“agent 平台”,本质上仍然是传统互联网的延续——一个个入口型网站、App Store 式的能力市场,各自维护自己的界面、服务与逻辑,彼此之间没有真正的互通与组合。
但真正的 AI 时代,不会从一个超级 App 开始,而是从一个开放、协同、去中心化的协议网络开始。
AgentNet,正是为此而生。它是开放的,是可协作的,是分布式的——它不是终点产品,而是一条通往未来的道路。
我们提议
如果我们希望 agent 真正能够协作执行、自由调度,并与外部世界打通,我们就必须重新定义agent。
在 AgentNet 中,我们提出一套三层协议栈,用以规范 AI agent 的身份、行为、协作与服务暴露方式。
在这套体系中,我们明确区分两个角色:
- Agent:始终代表个人或组织本体的智能体,是执行发起方,像是安装在你“本地”的 AI;
- Service:对外暴露的 agent,它以能力的形式被发现、调用,可以选择性地暴露 UI 组件或交互结构,类似拥有公网 IP 的服务器。
从这个视角来看,Agent 更像一台主动发起连接的客户端设备,而 Service 更像一个可被发现与访问的服务节点。Agent 和 Service 之间的交互,不再依赖传统的人类 UI,而是通过标准化协议进行能力匹配、任务调度与数据协商。
我们将整个协议栈抽象为三层结构:
- Assign Layer(指派层):定义和运行个体的 sub-agent 网络,是你的“私有智能域”;
- Service Layer(服务层):聚合外部的可调用服务,每一个服务都以 Agent 形式被封装并暴露能力;
- Developer Layer(开发者层):提供定义协议、发布服务、注册能力的接口,是整个网络演化的底座。
Assign Layer:你的私有智能域
所有由你控制的 agent,都在这一层运行,它们始终代表你本人的利益。
每个智能域的核心是一位总协调者,我们称之为 AI Minister——它是你数字世界中的“执行首脑”,拥有完整的上下文、权限配置能力,并可以根据需要创建、授权新的 SubAgent。每一个 SubAgent 的生命周期、权限、能力范围,均通过 AMS(Agent Management System) 管理与调度,并由其负责与外部世界打交道。
这实际上是一种全新的数据权限架构。
传统的应用模型中,用户在下载 App 时需要提前授权访问大量信息,但在授权之后几乎无法控制数据如何被使用,权限的使用权被交到了服务提供方手中。
在 Assign Layer 中,权限不再直接赋予外部服务,而是首先交给你自己的 agent 进行评估、代理与控制。你将始终通过 SubAgent 发起请求、交换数据,并保持 “你才是主角” 的状态——即使你并不亲自执行事务。
我们也有意区别于目前一些 multi-agent 系统的实现思路。那些系统往往将任务横向拆分为多个临时性 sub-agent,流水线式执行,再将结果聚合。这种模式适合单次任务,却难以支撑多轮交互、状态维护和 agent 之间的深度协作。
在 AgentNet 中,SubAgent 是具备生命周期管理、状态持久性、异步协作能力的长期 智能体。它们不仅可以在 AI Minister 的指令下协同完成任务,还能够在运行过程中根据新的发现主动回报,并由 Minister 决定是否进一步上报给用户。
这更像是一个 “智能政府” 系统:Minister 是你的智能内阁首脑,SubAgent 是不同岗位上的职能部门——它们被按需任命,有明确分工,也有自主处理能力。
从更哲学的角度看,Assign Layer 就是你与数字世界的边界线。它代表的是“我是谁”、我对谁授权、我如何表达意图、我如何信任他人。AI Minister 和它指派的 SubAgent,将逐步成为你的数字家人——他们只服务你,只代表你,也永远只为你着想。
Service Layer:去平台化的能力网络
在 Assign Layer 之上,是 Service Layer。这是整个系统中面向外部世界的服务汇聚与交换层。
通俗地说,Service Layer 就是 Agent 世界的“能力市场空间”(Agent Market Space),它承担的角色,类似于今天的 App Store,但本质上更开放、更灵活。
在这个层级,任何公司、组织或个人开发者都可以将自己的功能、模型或服务,通过协议封装成一个 Service Agent 并“上架”到网络中。服务不是静态的资源文件,而是一个具有可交互能力、可被调度、可组合的智能体。
这也意味着服务不是死板的 API,而是具有“对话能力”的主体。与一些当前流行的 MCP Server 模式不同,MCP 更像是在传统接口上加注了一层自然语言注释,本身并不具备上下文能力或交互状态。在 AgentNet 中,每一个 Service 必须以 agent 的形式存在,它能够真正“理解”请求、与 SubAgent 协调、在必要时发起反向询问。
此外,Service 可选择性地暴露一组 UI 组件定义。这些组件并不直接渲染给用户,而是由用户本地的 SubAgent 根据语境、偏好与权限,动态组合并决定是否、如何展示。这意味着,每个用户看到的界面都可能不同——不再是千篇一律的 App,而是“一千个用户,就有一千种界面”。
这是一种对 App 模式的根本性革新。
就像 iPhone 之前的手机依赖实体按键那样,今天的人们依赖大量不同的 App 与网站完成不同的任务。而在 AgentNet 中,交互变得高度可组合、可协商。SubAgent 将从多个服务中提取数据和能力,以一种对用户而言最自然的方式呈现出来——无论是 UI 组件布局、内容排序,还是触发方式,用户都可以通过 SubAgent 进行偏好控制。
服务之间也可以互通、互补,数据与能力不再被封锁在单一入口中。
更重要的是,Service Layer 具备评价与发现机制。每一次服务调用都可以被 SubAgent 自动记录与反馈,形成去中心化的信誉网络。优秀的服务不再依赖广告或流量倾斜,而是依靠真实的协作表现赢得更多调用机会。那些响应慢、沟通能力差、失败率高的 Service,将自然被 Agent 网络淘汰。
这是一次从“平台导向”到“能力导向”的转变:不是谁流量大谁获胜,而是谁能真正理解、协作、交付,谁就能获得更高的 Agent 优先级。
Service Layer 是 agent 之间的“语言市场”,也是未来智能服务生态的真正基础设施。
Developer Layer:每个人都可以发布能力
最上层是 Developer Layer。在这一层,开发者的角色不再局限于写代码,而是定义服务、行为与交互的人。
任何现有的 App 或网站,都可以轻松被封装为一个 Service 接入网络。甚至不止如此——许多非技术行业也可以被转化为服务:家电维修、体育培训、餐饮预订……都可以通过简单描述、协议绑定,成为 agent 可调用的能力单元。
未来,不是每个人都需要会编程,但每个人都需要能向世界清晰表达“我能做什么” 。Agent 会替你协商、组织、呈现;你只需要提供价值本身。
AgentNet 不是工具商店,而是一个去中心化的能力发布网络。服务的好坏,不靠运营包装,而由 agent 的调用频率和用户真实反馈决定。你服务得好,网络自然会找到你。
Developer Layer 让 AgentNet 成为一个不断生长的生态系统——既开放,也自我演化。
如果我们真正希望 agent 走向前台,代替人类处理那些复杂而琐碎的事务,那么类似这套网络的逻辑与协议标准将是不可回避的前提。
AgentNet 不是一个产品,而是一套基础设施——为即将到来的海量 AI 应用,搭建好舞台。
未来
2025 年的夏天,AI 应用迎来了井喷式爆发。然而人们的思维方式,依旧停留在门户时代:每家公司都在搭建自己的前后端,依赖搜索引擎收录来被“看见”;每个用户被各种新项目轮番轰炸,却很难判断,哪些是真正能改善生活的。
大厂在疯狂卷算力,烧出一个个更聪明的模型,却迟迟找不到规模化的变现路径。AI应用则用 WebAgent 技术与网站防机器人验证码博弈,试图撬动旧世界的一点缝隙。
但如果我们拿错了地图,走得再快,也只是更快地走错方向。或许现在,是时候换一张为 agent 而设计的地图了。
“The people who are crazy enough to think they can change the world are the ones who do.”