LLM智能体驱动企业软件演进
企业软件指满足各政府、企业等组织需求的软件,我们可以简单的把企业软件分为数字化底座和应用工具两大块,应用工具主要指工业软件(专业工具)和信息化应用,如下图所示。【AI大模型教程】
数字化底座是信息化和专业应用(工业软件)的基础平台。一般来说,包括云基础设施、数据集成平台、业务应用集成平台等。随着云、容器、微服务等技术的发展,基础资源管理和服务部署的解决方案已经形成共识,企业数字化应用的难点聚焦到应用和数据集成。企业软件从一体化应用到组装式应用的演进,本质上是要解决个性化应用、业务/数据敏捷集成、成果复用的问题。
通过低代码工具实现组装式应用的开发、集成和治理被视作个性化用户体验和业务组装能力的一种方式,近年来成为数字化底座的一种基本能力。但从实践来看,业务理解、组件适配和集成编程这三大环节中,编程并不是难点。随着IT部门和业务部门融合成为新的趋势,理解业务的团队同时具备IT及编程能力,核心还是回到组件产品本身的研发和基于业务理解的个性化适配与组装,依靠传统的软件方法,很难在这个问题上有实质性突破。针对这一点,大模型智能体(LLM-based agents)的应用,可以给我们新的思路。
LLM在数字化应用的各个层面,几乎都能给我们加持,其预训练知识、上下文学习能力、泛化能力等已经在各种应用场景上已经取得广泛的成功。在应用或算法中,LLM可以承担编码器、预测器、助理、智能体等各种角色,下图是其能力和应用的简单示意[2]。
AI智能体是指能感知输入,目标推理,并和环境互动以完成任务的自动化系统[3]。在过去的AI研究中,智能体一般用于强化学习,其基于简单单一的策略行动,在孤立和受限环境中学习。而基于LLM的智能体(LLM-based agents)是指在开放真实的环境中,将LLM作为核心推理模块来理解输入、规划行为和产生输出的具备类人决策能力的自动化系统[4]。下面我们从LLM智能体的构建、协同和演进几个层面来简单说明,如下图[5]。
LLM智能体的构建基于其强大的推理能力、工具使用和环境交互能力以及记忆能力。近来,基于COT(Chain of thought)开创的任务分解和基于反馈的迭代提升方法,使LLM智能体的推理规划能力大为提升,这已经成为了智能体的典型工作范式[6]。显然,在这个流程中,评估也可以基于LLM,即所谓LLM-as-a-Judge。
工具使用显然大大拓展了智能体的能力边界,近来大热的MCP(模型上下文协议)让LLM安全、便捷地连接并使用各种外部工具和服务,快速形成了生态。所谓记忆能力,可以分为短期记忆(Short-Term Memory)和长期记忆(Long-Term Memory),前者处理会话保持、超长输入等问题,而后者可以表现为大火的RAG(Retrieval augmented generation),即通过数据库、互联网检索等方式获取知识,增强模型能力。关于RAG是个非常热门的研究和工程实践领域,如下图[7]所示,针对不同的场景,可采用不同的方法,甚至可以专门为RAG做一个智能体,即Agentic RAG[8]。
协同主要指多智能体框架下的智能体间协作解决问题,从目前实践看,单智能体,或者有明确专业分工的中心控制多智能体方案具有较好的效果,而去中心化架构、群体智能演进等研究在学术上是一个挺热的方向。LLM智能体要达到好的效果,关键是在迭代过程中自我学习,能力提升,这既包括通过微调等手段提升LLM本身的能力,也包括对智能体系统中的辅助模块进行优化,比如提示词、工具、知识记忆等。迭代中演进大大增强了LLM智能体的泛化能力,使其更易适应新的任务和环境,下图是一些典型的学习范式[9],限于篇幅,就不展开了。
从LLM智能体的应用来看,包括各种生产力工具;具有特定流程的业务,比如软件研发、科研过程;用于游戏、社交等领域的角色扮演等。我们回到企业应用场景,在业务集成、数据集成、专业工具上都可以大展身手。
应用集成组装至少可以从两个层面加强,首先是对业务的理解和应用组装方案,这其实就是一个推理和规划的过程,可以用LLM智能体来实现。其次,所谓的低代码/零代码平台,一般分为可视化开发,用DSL (domain-specific language)表达,或者说X as Code,然后用集成总线执行实现三个阶段,我们可以直接用LLM实现DSL的开发。组装式研发的另一个难点数据集成,不管是使用传统的ETL环节处理数据,还是采用数据主线,元模型驱动架构,都可以使用LLM智能体来辅助操作,理解匹配数据,或者直接生成数据处理代码。
企业级应用研发的重点是历史代码的理解和重用、基于数字资产的DSL编码和企业数字应用集成、企业应用环境测试等,这些领域我们基于LLM智能体进行了探索,大大加快了企业应用研发和组装的过程。
LLM智能体在企业软件的应用中,有两个关键要点,一个是数据,一个是闭环,两者相辅相成。这里数据是指企业数据、用户数据、业务数据,在闭环过程中沉淀,积累知识,提升能力,如下图[10]。闭环迭代是智能体演进和智能能力涌现的基础,这里的关键是评估和判断,针对不同的场景,要能明确Metrics,这一点,APE是一个很好的示范,可参看本公众号文章《APE智能电视节目生产——领域大模型典型应用案例介绍》mp.weixin.qq.com/s/r8D-uMqPX…。
总之,LLM智能体将极大地促进企业软件演进,几乎在各个层面上使企业软件能力得到提升,企业软件的研发与应用将进入“硅基时代”!