2026年:大规模为Agent构建基础设施(API、数据、环境) 这不是简单的技术迭代,而是整个产业重心的转移

0 阅读6分钟

今天的确惊到我了——这两天折腾的纯私有化部署的“巨硬”——我直接对话问一下今天下午还有没有回宜春的火车票,他居然真的模仿人类打开浏览器帮我填时间和出发地点和到站地点,然后检索返回数据给我。神奇的是,操作完成后,他还帮我把浏览器关了,免得占用资源。

3.1.jpg 图一,我在自家产品奥尔特云平台里输入“看看今天还有高铁到宜春吗”,然后AI回复说出发站是哪个,我再输入“深圳”。

3.2.jpg 图二,AI在后台自己打开浏览器,自己访问12306,自己输入出发站和到达站,再查询。

马斯克的巨硬(MacroHard)这是已经实现了吗,未来已来。

3.3.jpg

MacroHard是埃隆·马斯克旗下X.AI公司开发的AI项目,旨在通过模拟人类操作电脑的行为(如鼠标点击、键盘输入)来自动化办公软件任务。该项目直接挑战微软,目标是让AI像人一样使用任何软件,无需依赖API接口。

马斯克计划用AI智能体替代传统软件开发流程,目前已在孟菲斯部署了Colossus II超级计算机集群支持其运算需求。该项目名称是对微软的戏仿,体现了马斯克颠覆现有软件生态的野心。

3.4.jpg 这几年AI发展的基本脉络是:

2023-2024年:提升模型本身的能力(推理、理解、生成)。

2025年:提升Agent的工具使用能力(Claude Code、Manus)。

2026年:大规模为Agent构建基础设施(API、数据、环境) 这不是简单的技术迭代,而是整个产业重心的转移。 

总结:"AI在召唤。时代在召唤。谁能给Agent提供更多的原生接口、数据、工具,谁就被AI赏识,被市场赏识。"

也就是说,2026年的关键是——能直接帮我完成整个闭环,买张高铁票,并完成付款。也就是要为AI Agent构建基础设施,包括API,数据,环境等。

也就是要解决以下几个问题:

一是AI看网页,整个网页以前的逻辑是给人类看的,有大量的图文并茂的信息,AI看就是噪音了,会费大量的Token,成本也高,速度也慢。

二是大量的网站,此前都设法不让机器人操作, 要验证是不是人类在操作。

三是如果已经很熟悉的网页网站,人类是不需要太多思考,直接点击的,AI如果能把操作过的网站记忆下来,那也要省很多成本,不用深度思考费算力。

这算是三个拦路虎。

这不,产业就向解决这三个问题已经在靠拢了。

一、全球最大的网络基础设施服务商 Cloudflare 官宣:Markdown for Agents。

Cloudflare 就是那个你一上网就弹“请你证明你不是机器人”的公司,

它以前是 Agent 的死对头,把 Agent 挡在门外只让人进;今天它给 Agent 发了至尊金卡,让 Agent 和人一起进,让爬虫合法了。这意味着:以前的互联网是给“人眼”看的(HTML/CSS),现在的互联网开始专门为“AI眼”重构(Markdown)。在此之前,AI Agent 访问网页像个“二等公民”:必须从复杂的 HTML 屎山里扒拉出有用的文字。费力、费流量、费 Token。只要你的 Agent 在请求头带上 Accept: text/markdown,Cloudflare 就会在边缘节点把网页瞬间变成干净、结构化的 Markdown 给 AI。

这样下来,三个好处就明显了:

省钱(Token):Markdown 比 HTML 小 80%!以前爬个网页 1万 Token,现在 2千。Opus 和 Gemini 的账单直接打骨折。

变聪明(Context):同样的上下文窗口,现在能塞进 5 倍的内容。AI 能“看到”更多,幻觉更少。

极速(Latency):因为去掉了渲染和复杂的 DOM 解析,响应速度也是毫秒级的质变。为什么是 CLI + Markdown?
Cloudflare 这一步,实际上是在复古。Markdown 和 CLI(命令行)是绝配。

未来的互联网,可能不再是五彩斑斓的前端页面,而是无数个 API 和 Markdown 流,在终端里飞速穿梭。

3.5.jpg

3.6.jpg

3.7.jpg 二、MiniMax M2.5开源的消息。数据很漂亮:性能对齐Claude Opus 4.6,SWE-Bench 80.2%,推理速度是Opus的3倍……

M2.5给出的是:1美金/小时。在每秒输出50个token模式下,还能降到0.3美金/小时,北京一瓶矿泉水的价格。

这意味着什么?过去因为人力成本太高而"不值得做"的事情,现在都值得做了。

比如:电商平台100万活跃用户,想做个性化回访?按人力成本得雇几十个客服,一年几百万支出。现在一个AI Agent,可能几千美金就搞定。

而做到这么底的成本,核心主要依靠是一套叫"Forge"的训练体系,做对三件事:

1,让快的不用等慢的。通过"Windowed FIFO"调度策略,查天气这种快任务立刻处理,写代码这种慢任务交给专门模块,互不耽误,异步协同。

2,让"反复算旧账"不再发生。Agent干活会反复调用模型,每次都要"回忆"历史。Forge做了"前缀树合并",所有共享历史的请求只算一次,40倍训练加速就这么来的。

3,引入过程奖励。不只盯着最终结果,还看中间步骤。比如:有没有乱用工具?是不是绕了远路?完成任务花了多久?让模型学会"又快又好"地干活。所以,具有记忆功能了,像人类一样,对于熟悉的操作,更快更准了。
2026 AI能干更多的事情了,成本更便宜了。

中小企业请不起法务、财务、市场总监?现在可以1美金一小时,请AI法务审合同,AI财务对账,AI市场写方案。

印尼大学生打一天零工挣5美金,够AI干五小时,代码报错了贴进去问,算法看不懂用印尼语讲一遍。肯尼亚创业者想做跨境电商,把中文链接扔给AI,英文规格参数、物流条款几分钟出来。

1美金在硅谷意味着便宜到忽略不计,但在雅加达、内罗毕、圣保罗,它意味着第一次用得起和硅谷公司一样的AI能力。

并且。

每一次基础设施平民化,都会催生想象不到的新物种。印刷术变便宜时没人想到会催生报纸和小说;互联网变便宜时没人想到会催生电商和短视频;云计算变便宜时没人想到会催生SaaS创业的黄金十年。

现在轮到AI了。1美金/小时是起点。当SOTA级别的智能变成像水电一样按需取用的公共服务,你想用它来做什么?
参考资料:

1、【更新完!你的 OpenClaw 就是互联网顶配!今天是个值得纪念的日子...】

点击链接打开👉 m.toutiao.com/is/tmafZSps… tmafZSpsDHM` :9pm Axw:/ W@m.DH

复制此条消息,打开「今日头条APP」或「今日头条极速版APP」后直接查看~

2、【大家可能刷到了MiniMax M2.5开源的消息。数据很漂亮:性能对齐...】

点击链接打开👉 m.toutiao.com/is/YBWUq0Dm… YBWUq0Dmp8s` Axw:/ W@m.DH :4pm

复制此条消息,打开「今日头条APP」或「今日头条极速版APP」后直接查看~