1.背景介绍
企业一直都在努力提升效率,但如何提高产品交付质量却是个难题。传统的手工流程也不能很好的达到需求快速迭代的目标。而“Robotic Process Automation (RPA)”技术为解决这一难题提供了一定的便利。基于RPA的“Agent”和“Knowledge Graph”技术能够在保证准确性的前提下,实现在自动化测试过程中节约大量人力资源,加快流程的执行速度和效率。但是,仅仅靠技术还远远不够。只有更高明的工程化方法才能将自动化方案落地,而最重要的是要做好实际可行性研究,确认投入产出比后再进行开发。下面我们就通过一个企业级应用案例,从理论层面和实践层面,阐述如何用RPA+GPT大模型AI Agent自动执行业务流程任务,提高产品交付质量。
2.核心概念与联系
RPA
“Robotic Process Automation(RPA)”简称机器人流程自动化,它是一个基于规则引擎、图形界面、脚本语言的自动化工具,用来减少人工重复性工作,使得工作人员可以把精力集中于创造价值上。其特点主要有以下几点:
-
可编程性强:采用可视化界面,使得用户可以轻松理解业务流程并用代码进行描述。
-
灵活可控:提供大量开放接口及SDK(Software Development Kit),可以自由选择第三方服务或软件平台。
-
无缝连接:支持多种数据源的连接,包括本地数据库、云端存储等,并提供跨平台的移植能力。
-
模块化设计:将复杂的业务逻辑模块化,通过插件的方式扩展功能。
-
数据驱动:使用外部数据作为流程输入条件,确保流程运行结果的可重复性。
GPT-3
近年来,人工智能(Artificial Intelligence)、机器学习(Machine Learning)、自然语言处理(Natural Language Processing)等技术已经取得了非常丰硕的成果。其中,基于大模型(Transformer)的生成式预训练(Pretrained)技术(GPT)已成为事实上的主流。GPT模型具备极高的训练量和计算能力,它通过海量数据进行预训练,使得它在不同领域都可以达到最佳效果。与此同时,GPT-3则是这项技术的最新进展之一,它是一种基于Transformer模型的语言模型,能够理解、生成和管理多种文本信息。
Knowledge Graph
知识图谱(Knowledge Graph)是由实体和关系组成的三元组集合,每个实体都有一个唯一标识符和属性,每个关系也有一个唯一标识符和属性。在图谱中,实体与实体之间存在某种联系,比如实体之间的边缘关系;实体与关系之间存在某种联系,比如属性之间的关联。因此,知识图谱可以看作是一种半结构化的数据集合,旨在对现实世界中的复杂事物进行建模、组织和管理。
3.核心算法原理和具体操作步骤以及数学模型公式详细讲解
案例概述
这个案例的背景是,某公司在运营微信公众号时,需要自动化执行一系列的客户咨询回复工作。为了提高客户满意度,希望使用机器人助手完成工作。根据目前的资源,公司希望尽可能节省成本,所以希望能够使用GPT-3智能机器人GPTAgent自动化回答客户的问题。下面我们通过一个流程图展示该业务场景的流程:
-
用户发送给公众号客服留言或者消息,微信后台将其转发至智能助手GPTAgent处理。
-
GPTAgent接收到用户的留言或消息后,利用自身知识库(比如问答对话等)分析提取出用户的问题。
-
GPTAgent根据用户的问题进行检索,找出相似度最高的问题作为推荐答案返回给用户。
-
当用户确认了推荐答案,GPTAgent将该答案反馈至用户。
-
如果用户没有按照推荐答案进行操作,GPTAgent会为用户提供反馈建议,帮助用户改善问题的表达。
-
在完成一次完整的客户咨询回复后,GPTAgent会记录对话日志,并定期进行数据分析,改进机器人的性能。
下面我们将从知识图谱、GPT-3、业务规则三个方面来详细阐述该案例的实现过程。
知识图谱构建
什么是知识图谱?为什么要构建知识图谱?
知识图谱是一种半结构化的数据集合,它是对现实世界中复杂事物进行建模、组织和管理的一种方式。它的基本元素是三元组:实体(Entity)、关系(Relation)和属性(Property)。知识图谱存储了实体间的关联关系和实体的属性。知识图谱可以用来存储、整理、查询和分析复杂的信息,如互联网、医疗健康、电子商务中的数据、金融、制造业等领域的各种信息。
为什么要构建知识图谱?知识图谱是一类数据模型,其中包含许多实体、关系和属性。通过知识图谱,我们可以方便地检索、分析和推断出有关各个领域的各种信息。另外,借助于知识图谱,我们还可以利用不同的语义理解方法(如基于语义网的语义理解、基于规则的推理和基于统计学习的机器学习)对现实世界进行建模,从而加速智能助手的开发。
知识图谱的构建方法
构建知识图谱的方法有很多,这里我举两个例子。
-
方法一:基于API调用的语义解析 最简单的一种方法是直接调用知识图谱的API接口。例如,可以利用Freebase API查询某个实体的相关实体、属性、关系等信息。这种方法能够获取较为全面的知识信息,但需要消耗大量的网络资源。另一方面,对于一些琐碎的信息,API无法满足我们的需求。
-
方法二:基于文本语料的知识抽取 另一种方法是利用自然语言处理技术,对文本语料进行解析,提取出有意义的实体、关系和属性。这是一种启发式的方法,因为它并非所有的实体、关系和属性都能够被发现。但是,经过多轮的迭代,我们最终可以获得一个较为精确的知识图谱。
知识图谱的组织形式
知识图谱的组织形式分为三种:
实体-关系型(Entity-Relationship Modeling):这种类型通常用于存储静态的、固定的知识,如机构的名称、职位的定义、国家的形状等。实体之间用关系(如is a、has a等)连接起来,表示其属性之间的关系。实体关系型的组织形式比较简单,适合管理静态的、不太变化的知识。
属性-值型(Attribute Value Modeling):这种类型适用于存储动态的、变化的知识,如股票市场的价格、交通运输的路况等。实体可以有多个属性,每个属性都可以有多个值。属性值型的组织形式比较复杂,适合管理动态的、变化的知识。
混合型(Hybrid Modeling):这种类型既具有实体关系型的特征,又具有属性值型的特征。实体和关系可以像实体关系型那样用关系连起来,也可以像属性值型那样拥有多个值。混合型的组织形式比较复杂,一般用于结合两种模型的优点。
知识图谱的标准
知识图谱的标准有很多,但最常用的还是W3C RDF(Resource Description Framework)和OWL(Web Ontology Language)。RDF是一套基于Web的资源描述框架,它提供一种数据模型来描述资源之间的链接关系。OWL是基于RDF的 ontology language,它支持常用的ontology,如 owl:Class、owl:ObjectProperty、owl:DataProperty等。知识图谱可以通过导入这些标准的格式来构建。
GPT-3的原理和应用
GPT-3的原理
GPT-3的原理其实就是用神经网络语言模型的方式,来训练生成模型。这样一来,当我们输入一个句子后,它就可以根据上文、之前的生成来推测出之后的词。GPT-3模型是在开源项目OpenAI GPT-2的基础上,做了一些修改,并引入了新的特性,提高了生成性能。
-
Transformer模型:GPT-3模型的核心就是transformer模型。相比于RNN、LSTM等模型,transformer模型的计算成本低、训练效率高、参数共享等特性更符合生成序列数据的要求。
-
使用大量数据训练模型:GPT-3模型在训练的时候使用了超过10亿条文本语料,并根据它们的分布采样算法,随机抽样了100万个样本,训练得到了一套强大的语言模型。
-
生成新文本:GPT-3模型的生成策略依赖于连续生成(continual generation)机制,即每次只需关注模型的当前状态,不需要考虑历史状态。这样可以避免模型困惑,生成更逼真的文本。
GPT-3的应用
-
对话系统:GPT-3已经广泛应用于智能对话系统。除了聊天机器人外,还包括问答系统、意图识别系统、实体搜索系统等。
-
文本摘要、问题回答等自然语言处理任务:GPT-3可以在几秒内生成长文本的摘要,而且生成的内容质量非常高。还可以用于回答对话系统中的问题,根据上下文自动生成答案。
-
文本生成:GPT-3可以用于生成具有多样性、连贯性的文本。不仅仅局限于语言模型生成的文字,还可以生成图像、音频、视频、代码等媒体内容。
-
分类、排序、检索、推荐等多种任务:GPT-3可以用于多种任务,如文本分类、排序、检索、推荐等。由于GPT-3模型的参数量巨大,训练起来非常昂贵,但它也是目前最先进的语言模型。
业务规则
为何需要业务规则?业务规则的作用是什么?
业务规则,顾名思义,就是企业内部制定的一些操作规则。这些规则既涉及到财务、生产、质量、安全等领域,也涉及到人员行为、物流、仓储、服务等方方面面。比如,一些业务规则规定了在某些情况下,应开展某项活动或销售某种产品,这就是典型的业务规则。但业务规则也不能完全替代IT技术,因为有些时候仍然需要IT来支持业务规则的执行。
业务规则的作用主要有以下几个方面:
-
提高工作效率:业务规则能够有效地减少人力成本,提高工作效率。例如,某些业务规则规定了一定数量的订单,每周只能处理一批,那么如果机器人能够自动完成这些规则的执行,就可以大幅降低人工成本。
-
提高客户满意度:业务规则也会影响到客户满意度。例如,一些活动促销期间,人们往往担心退货或赔付损失。如果员工可以通过机器人在规定时间内完成退款,就可以大大提高客户满意度。
-
节约成本:业务规则能够节省不必要的费用。例如,企业可能存在一些老旧设备,比如打印机,业务规则可以指定只允许使用最新的打印机。如果使用机器人来完成业务规则的执行,就可以节省更多的成本。
-
避免法律风险:虽然业务规则不能完全代替IT,但它们的确起到了一定的监管作用。例如,如果一项业务活动违反了企业的政策法规,那么业务规则就会成为企业的一个有效的工具,用来阻止违规行为的发生。
如何构建业务规则?
构建业务规则的方法有很多,但通常都会遵循以下五个步骤:
-
确定规则目的:首先,需要明确规则的目的,判断规则是否能够解决特定问题。
-
明确规则范围:确定规则的范围,比如哪些部门、哪些区域或地点、什么时候或地点需要执行规则。
-
收集规则样本:收集规则样本,将企业内部的所有操作数据和信息都进行分析和汇总,形成规则样本。
-
训练规则引擎:基于规则样本,训练规则引擎,让机器能够识别、匹配和执行业务规则。
-
测试规则的有效性:最后,对规则进行测试,评估规则的有效性。如果规则有效,那么就可以部署到生产环境中,让企业享受到规则带来的效益。否则,可以对规则进行调整或废除。
如何进行机器人测试
机器人测试主要分为以下几步:
-
清楚定义:首先,需要明确测试目标,比如要测试机器人自动回答客户的问题、完成结算等。
-
设置测试场景:设置测试场景,制造出真实的客户场景,模拟出各种可能遇到的情况。
-
制订测试计划:制订测试计划,列出测试方案,设定测试时间表和成本预算。
-
执行测试:执行测试,收集测试数据,分析数据结果,并将测试结果反馈给开发团队。
-
分析测试结果:分析测试结果,总结测试数据,确定测试结果的可靠性。如果结果不理想,则重新设计测试方案或调整测试对象。