利用 coze + agent 落地企业级 AI 知识库方案假如存在这样一个知识库AI，我们将财务相关的流程知识交给他，

知识库的必要性

不知道大家是否有这样的体验，在公司我个人偶尔会有一些发票需要报销，因为技术岗位的对外场景不多，所以使用走报销流程的场景也很少，可能一个月就一次，每次我进行报销，填写报销单上的信息的时候，比如当我手上拿着“运输服务*客运服务费”的时候，我心里都会很疑虑，报销单上填写交通费？还是运输服务费呢？

每当这个时候，我都要去咨询我们的财务同学，我们的财务同学再告诉我，应该填写什么，但是问多了，都会有些尴尬，因为几乎每次报销可能都会出现一些填写上的错误，然后反复咨询，这对当事人、财务都是一种低效工作。

假如存在这样一个知识库AI，我们将财务相关的流程知识交给他，后续我们不再需要去找财务，而是通过与AI对话就能了解该怎么做、报销单的范本、注意事项，让AI替代财务的审核报销单这件事，岂不是大大节省双方的工作量，提升工作效率？

在以chatGPT为代表的大模型时代，搭建一个知识库AI不再是一个遥不可及的梦想，不需要写一行代码，人人都可以搭建出一个非常强大的知识库AI。

在正式开始知识库AI的介绍之前，我想带大家一起回到20世纪50年代，一起看看早期人工智能知识库如何实现，有什么缺陷，以及为什么大模型可以实现真正的知识库AI。

人工智能学科早在其萌芽阶段，人工智能的大牛们就不断尝试让人工智能理解人类知识，并对人类的语言做出类似人类的反馈的超级梦想。

而早期的实现方案比较原始，使用了通用问题解决器（General Problem Solver），也被称为专家系统的技术方案进行解决。

专家系统本质上就是录入问题与答案，当用户问问题的时候，将匹配到的答案呈现给用户。

大家想象一下5年前的车机系统，其语音功能只能针对一些特定意思的简单的短句做出反馈，稍微复杂一点，或者超出了车机知识的范畴，专家系统便无法正常工作，这样的反应，很显然距离真正的“人工智能“还差的远。

以开车场景下驾驶员对车机说“风有点大，帮我关闭窗户”作为例子，车机也许够做出适当的反馈，甚至你只需要说“风有点大”，车机就能明白驾驶员需要进行“关窗”这样的行为；

但是我们想象一下，虽然车机做出了我们预期的反馈，但是车机其实并不懂得这句话的意思，也并不理解“冷”的含义；车机的理解更加像是文字与行为的匹配、关键字的匹配，进而完成相应的操作，比如冷 = 关窗户，至于文字究竟是什么意思，车机并不明白；

如果我们想让这样的车机达到我们预期的“人工智能”，其背后我们则需要输入无数这样的文字与行为的匹配，让他按照字典的方式去对人类的行为进行反馈；

即使这样的车机拥有海量的字典知识，让绝大部分人都无法第一时间感觉到“机械感”，但是稍微复杂的问题，即便会露馅，更别提类似人类的操作了，这远远不是我们期望的人工智能。

而我们的大语言模型的天生对自然语言有这强大的理解能力，加之使用合适的技术手段，将知识库与AI进行融合，让AI像人类一样理解知识，做出合理的反馈，这已经不是遥不可及的梦想。

既然我们要去实现知识库，我们便需要将公司内部的文档交给大语言模型，让大模型理解知识库的知识，这样才能发挥大语言模型的能力，实现让AI正确的读懂，我们上传的资料呢？

技术知识大家大致了解就好，实际搭建AI知识库并不涉及技术部分。

在大语言模型时代，我们拥有了杀手级的工具来实现针对大语言模型的知识补充；

RAG，全称是Retrieval Augmented Generation，中文含义为检索增强生成。

这个工具的实现流程是什么样呢？

数据准备阶段
1. 上传知识库
2. 将文本按照期待的格式进行分割
3. 使用一种称为embedding的技术将文字向量化，让AI理解我们的知识库
4. 存储我们的向量数据
提问+回答阶段
1. 用户提问
2. 理解用户的问题，并更具语义召回相关文字片段
3. 大模型结合问题 + 答案进行理解，并回答用户的问题