许多全球至关重要的系统——处理资金流转、航班预订、许可证发放和理赔申请的系统——都存在运行缓慢、结构脆弱且严重过时的问题。这些系统建于几十年前并经过反复扩展,如今已成为核心工作流的中枢,这些工作流太过重要,无法暂停、离线、重建或替换。
在某机构的通用人工智能实验室,团队训练代理的对象不是理想化的接口,而是这些遗留系统的高保真模拟环境。通过学习这些系统的真实行为——包括各种怪癖、延迟、错误状态和不可见的依赖关系——可以实现一种不同的创新方式,这种创新基于现有系统成长,而不是要求替换它们。并且,通过在后台管理遗留系统的种种特性,该代理实际上变成了一个通用API——一个可供用户执行各种特定任务的单一接口。
为日常生活提供动力的遗留系统
走进任何大型机构(银行、保险公司、医院、政府机构)的幕后,你都会发现同样的情况:一层维持软件运转的无形人力劳动。人们知道必须按什么顺序点击哪些按钮,哪些警告可以忽略,哪些字段必须输入两次,哪些屏幕绝不能刷新。驾驭这些异常特性所需的机构知识,如同遗留系统的口述传统一样代代相传。
这些工作流之下的许多基础设施,比管理它们的人还要古老。现代金融、保险、旅行、科研和公共服务的软件主干形成于20世纪60和70年代,构建于大型机架构之上,并使用COBOL和FORTRAN等语言编写——这些语言是为稳定性而非适应性而设计的。
当互联网到来时,机构并没有重建,而是进行了封装。Web表单驱动大型机作业,中间件将现代输入转换为几十年前的格式,企业门户则堆积在从未被重写的业务规则之上。随着时间的推移,现代化变成了一层层的堆叠:最底层是大型机指令集;上面是20世纪90年代的数据库;再上面是2000年代的门户;而一个现代Web界面则掩盖了所有下层。今天,一个单一交易可能贯穿所有这些层面——脚本、连接器和集成以一种无人完全理解的方式将它们维系在一起。
替换这些系统的尝试常常停滞不前。会出现无人知晓的依赖关系,迁移失败,预算失控,公共部门的现代化工程在其自身复杂性下崩溃。这些系统无法离线,这意味着无论它们变得多么脆弱,机构都必须持续运行它们。对于某机构来说,这是Agentic AI最引人注目的应用之一——不是去驾驭那些光鲜亮丽的网络时代消费应用,而是深入那些维持机构运转的、缓慢而沉重的架构。
学习缺陷以修复缺陷
训练AI代理最难的部分,不是教会它成功的流程是什么样,而是教会它工作流为何会失败。遗留系统背后的逻辑通过摩擦最清晰地展现出来:一个因编码了顺序规则而姗姗来迟的模态窗口;一个在另一值保存前拒绝输入的字段;一个因后台作业中途重启而重置的表单。这些行为不是故障,而是系统真正的语义。
某机构AGI实验室的研究人员主动寻找这种摩擦。为了安全且可重复地展现故障模式,该机构在强化学习环境中训练代理——这些合成环境旨在重现嵌入真实工作流中的怪癖、延迟和顺序规则。这些环境包括模拟州政府机构、航空公司预订以及专门的税务和福利处理等系统的合成Web环境,总数达数百个。
一位从事代理训练和回放系统工作的AGI软件工程师直言不讳:“我希望我们强化学习训练环境拥有所有的缺陷,所有的问题。”
这就是“学习缺陷以修复缺陷”的含义:在系统真实行为的全频谱上训练代理,包括缺陷、不一致、延迟以及人类默默地适应了的所有嵌入历史。通过让代理暴露于人们每天都要面对的同样“破损”之中,该机构训练它们超越表面的正确性,去理解界面之下更深层的逻辑。
代理作为新的接口层
一旦代理能够可靠地驾驭遗留接口的种种特性,更有趣的事情就开始发生了。研究人员观察到代理不仅能推断出下一步点击什么,还能推断出为什么要点击——即界面所表达的潜在工作流。在一个模拟的福利申请环境中,一个意识到自己只添加了一个受抚养人的代理,能够导航回去,纠正遗漏,并在不重新开始的情况下恢复流程——这是理解系统本质的早期迹象。
对实验室成员来说,这标志着一个架构上的转折点。许多机构系统根本没有能反映真实工作流行为的API;逻辑的唯一忠实表达就是界面本身。正如那位工程师所说:“用户界面被设计为可发现的、可学习的——即使它很糟糕。”当代理足够深入地学习那一层,能够预测结果并从失败中恢复时,它们就开始充当一种合成API——一个在无法更改的基础设施之上的稳定的、可编程的表面。这种转变开启了新的架构可能性:
- 在不稳定的UI上提供稳定语义:代理将不一致的行为(延迟、重新渲染、部分保存)转化为可预测的模式。
- 跨系统抽象:因为代理是基于工作流而非应用程序进行推理,它可以桥接从未被设计为可互操作的系统。
- 增量式现代化:机构可以逐步更新组件而不破坏工作流;代理吸收过渡期间的脆弱性。
- 保留机构逻辑:代理保留原本仅存储在人类记忆中的操作知识——无人记录的规则、顺序、依赖关系。
这不是工作流自动化。这是为世界上最古老的系统建立的一个新的接口层——一条无需关闭任何设备的升级路径。
未来的工作
Agentic AI不会取代那些构成日常生活的行政任务(预订假期、更新执照、安排医疗预约),但可以帮助提高这些任务的效率,让曾经因过于脆弱而无法改变的系统得以演进。
这种脆弱性正变得越来越严峻。构建了20世纪60年代和70年代机构主干(COBOL批处理作业、FORTRAN例程、大型机集成)的程序员们正在退休。很少有年轻开发者学习这些语言,而这些系统中嵌入的知识每年都变得更加难以获取。关键工作流现在运行在日益无人理解其内部运作的软件之上。
代理提供了另一种形式的连续性。通过直接从系统自身(而不是丢失的文档)学习这些系统的行为方式,它们可以保存否则会消失的操作逻辑。它们可以稳定运行在无人能安全重写的代码之上的工作流,并承载那些否则会随劳动力一同老去的机构知识。
从这个意义上说,“未来的工作”是双重的。一方面是构建能够满足这些环境所要求的可靠性的代理的技术工作。另一方面,当人们不再被困在脆弱的界面内部时,新的可能的人类工作便出现了——这些工作基于判断、协调、同理心和设计,而不是死记硬背哪个字段必须输入两次。
代理不会重建我们数字世界的根基。但它们可能会重建另外的东西:我们认为创新只来自替换的观念。通过将脆弱的系统转变为稳定的平台,代理提供了一种新的进步模式——一种从已有可行之物上生长出来的模式。FINISHED