2. 高级:动态添加结构(迭代RAS循环)
在先进的RAS系统中,结构化过程通常是动态且迭代的,结合分类法和知识图谱来使上下文与查询相匹配。
这种技术被需要更具动态性的高级RAG应用程序所采用。在这里,我们会动态地构建并完善一个专门针对用户查询定制的结构化知识上下文。
以下是RAS构建和运用知识回答问题的四个关键阶段:
按回车键或点击以查看全尺寸图像
检索与结构化(RAS)框架概述[来源]
阶段1:行动计划(明确你需要什么)
这是战略起点。该系统充当指导整个过程的规划者。
1. **评估需求:**规划器模型首先查看主要问题,以确定是否已经掌握了足够的信息。
2. **无检索:**如果模型判定可以直接利用其现有知识回答问题,则流程到此为止。它会直接进入生成答案的环节。
3. **生成子查询:**如果知识不足,规划器会策略性地确定知识需求。它会生成一个有针对性的子查询,这是一个较小、聚焦的问题,旨在填补知识中的特定空白。
这种迭代规划机制有助于RAS超越旧的单次通过方法的局限性。
阶段2:主题范围检索(高效查找信息)
一旦规划器生成子查询,RAS必须找到相关文档。与仅依赖一般相似度的传统RAG不同,RAS采用主题范围的方法,显著缩小了搜索空间。这使得检索速度更快、更有针对性。
1. **主题界定:**系统使用分类器来确定子查询的主题分布。然后,它利用这些主题信息将搜索范围缩小到特定主题的子语料库。
2. **密集检索:**系统仅在这个较小的相关子语料库中执行语义匹配,以找到最相关的文本段落。
阶段3:动态知识结构化(组织事实)
这是定义RAS的阶段。它将检索到的非结构化文本转换为清晰、有条理的事实。
1. 文本到三元组转换:检索到的文本段落被转换为一种结构化的图表示,即知识三元组(主语-谓语-宾语事实)。这种结构化格式便于进行高效推理。
2. **迭代式丰富:这些新事实被合并到一个不断演进的知识图谱(KG)**中,该知识图谱专门针对主查询。这个知识图谱会随着每次迭代而增长和扩展。
3. **重新评估:**在知识图谱得到丰富后,行动规划器会审查新积累的知识。它会判断这些知识是否足以回答主查询,或者是否需要生成另一个有针对性的子查询来继续检索过程。
阶段4:知识增强生成(结构化回答)
最后一步。一旦规划器认为结构化信息足够,回答器模型就会接手。
1. **利用结构:**回答者利用积累的、编码的知识图谱,以及子查询链和检索到的事实,生成最终响应。
2. 准确输出:通过将其回答建立在知识图谱(KG)的精确、结构化知识之上,该模型能够生成准确、连贯的答案。这种结构化推理能力有助于RAS在复杂任务上超越旧的检索增强生成(RAG)方法的性能
因此,总结迭代RAS周期中的所有步骤。以下流程有助于更好地理解该过程和步骤。
按回车键或点击以查看全尺寸图像
RAS中的步骤 - 图片由作者(Vivedha Elango)提供
实施RAS高级版(迭代RAS循环)
该RAS论文的代码实现可在此处访问。 您可以按照说明设置RAS并测试它是否适用于复杂的查询。
按回车键或点击以查看全尺寸图像
性能比较 - {源}
RAS中的技术挑战:
检索与结构化(RAS)方法为使大语言模型(LLMs)更智能、更有用开辟了新途径。但它并非没有障碍。要让RAS充分发挥潜力,研究人员仍需应对一些棘手的技术挑战。
这些挑战大多集中在三个相互关联的领域:我们获取信息的速度有多快,信息的质量如何,以及所有信息的整合程度如何。
1. 检索效率
第一个挑战是速度。随着数据量的增长,快速、准确地找到正确信息的难度也在增加。
**扩展性和延迟:**更大的模型和更大的数据库意味着检索系统承受更大的压力。由于RAS中增加了额外的步骤,它的延迟更高。
密集检索增强生成(Dense RAGs)和检索增强生成(RAS)的延迟比较 — [来源]
真正的挑战在于如何确保在大规模情况下,结果仍能保持快速且相关。这将需要新的索引和处理高容量请求的方法,同时又不降低速度。
**自适应策略:**并非所有查询都是相同的。有些查询简单,有些则复杂。系统需要进行自适应,决定何时深入挖掘,何时进行表面搜索就足够了。这种灵活性既能提高性能,又能改善用户体验。
2. 知识质量
需求分析系统(RAS)依赖于将杂乱无章、非结构化的文本转化为清晰、结构化的知识。这并非易事。错误会悄然出现,不一致性也会显现,而这些都可能破坏整个系统。
**噪音和不一致性。**用于构建分类法和知识图谱的自动化工具可能会在数据中引入错误或矛盾。
**稳健验证。**质量控制至关重要。未来的研究需要更强大的验证方法,理想情况下是引入领域专家并允许迭代改进的方法。
**跨领域的连贯性。**知识并非千篇一律。医学、法律和工程学各有其自身的规则和背景。挑战在于构建结构化知识,既尊重这些差异,又能在各个专业领域中具有意义。
3. 集成复杂度
即便有快速检索和高质量知识,最困难的部分可能还是整合。让结构化信息与大语言模型推理协同工作绝非易事。
**协调不同来源。**知识来源广泛。不同来源可能相互冲突、重叠或过时。系统需要有办法解决这些问题,同时保持信息的时效性。
**保持一致性。**随着新数据的添加,旧知识可能需要更新。增量学习和冲突解决对于保持一切协调一致至关重要。
**实时适应性。**大语言模型不仅需要准确的数据,还需要实时的数据。这意味着框架要能够即时摄取和协调信息。
**平衡性能。**最后,存在着权衡。更多的结构往往意味着更多的计算开销。挑战在于在不降低大语言模型速度的前提下,赋予它们更丰富的推理能力。
研究机会
检索与结构化(RAS)方法仍在不断发展。随着数据在类型、规模和复杂性上的增长,未来研究有几个很有前景的方向。
多模态知识整合
如今的数据不只是文本,还包括图像、视频、音频等等。未来的RAS系统将需要无缝处理所有这些数据。
这意味着要构建统一的索引策略,以便在不同格式之间建立意义联系。例如,将视频片段与一段文本关联起来,或将图像与音频描述关联起来。将视觉语言模型与文本编码器相结合的神经架构是朝着这个方向迈出的一步。它们使大语言模型能够跨格式进行推理,并在回答中参考非文本线索。
跨语言系统
知识不受语言的限制。但大多数结构化系统仍然如此。
多语言嵌入和并行语料库等技术有助于构建跨语言的分类体系。迁移学习也可以发挥作用,复用资源丰富语言的结构来支持资源较少的语言。为了进一步提高准确性,标准化的跨语言基准和强大的领域适应方法将至关重要。
交互式和自我完善系统
静态检索系统存在局限性。人们希望自然地优化查询,通常是通过对话来实现。
交互式界面可以支持这一点。与此同时,诸如使用强化学习或元学习等自我完善机制,可以帮助系统发现并纠正自身的错误。更妙的是,如果模型在适应用户反馈的同时能够解释其纠正步骤,那么它们不仅会变得更智能,而且会更透明。
人机协作框架
对于复杂的结构化任务,人类的专业知识仍然至关重要。专家可以完善分类法并审查边缘情况。众包有助于保持数据的相关性和时效性。人机AI框架在确保系统遵守隐私和公平原则方面也发挥着作用。真正的优势来自于将机器的规模与人类的判断力相结合。
个性化知识传递
并非所有用户都想要相同的东西,也并非所有用户都以相同的方式提问。个性化通过考虑用户画像、过往行为或直接反馈,使检索更具相关性。当然,隐私保护方法需要从一开始就融入其中。随着时间的推移,这些系统可以通过在核心架构之上叠加上下文线索来进行自适应调整。
结语:
检索与结构化(RAS)方法是将大语言模型从令人印象深刻但并不完美的工具转变为可靠的、知识驱动的系统的下一步。
传统的检索增强生成(RAG)试图通过引入外部文档来解决现有问题。这有一定帮助,但还不够。RAG在面对杂乱无章、非结构化的数据时往往会失效。重复、不完整或难以解析的信息仍然会使其陷入困境。
RAS的核心思想很简单。我们将非结构化数据转化为结构化、可验证的知识。我们通过使用文本结构化方法来构建分类体系、创建层次结构和提取实体来实现这一目标。
不过,RAS领域仍面临挑战。检索需要更快、更具可扩展性。知识图谱在发展过程中需要保持准确和连贯。结构化数据必须得到维护、完善和验证。
展望未来,RAS研究正朝着更深入的集成和适应性方向发展。这包括能够处理不同类型数据(如文本、图像、视频和音频)的系统。它正朝着跨语言结构发展,这种结构可以在不同语言之间共享知识。