[笔记][大模型学习]20-llama-index核心组件

72 阅读2分钟

大模型应用

  • 微调
    • 功能: 能够让现有的开源大模型理解我们自己的(私有化)数据。

    • 特点:需要做模型的二次训练(成本,风险)

    • 应用场景:当需要去改变大模型自身特性时,就得用微调(风格),微调本身调整的是大模型的风格,而不是大模型的能力(智商)。另外可以加强大模型对当前私有化数据的理解。

  • RAG
    • 功能: 能够让现有的开源大模型理解我们自己的(私有化)数据。
    • 特点:相对微调来讲,成本更低,风险更小。
    • 应用场景:事前不训练模型,但需要让模型直接根据我们的数据来进行作答。
      • 如果不涉及模型回答风格,仅需模型对当下的私有化数据做出回答,那么就用RAG;如果涉及到大模型回答风格,或者当前模型对私有数据理解不够准确,再用模型微调技术。

Llama index

llamainde是一个用于llm应用程序的数据框架,用于注入,结构化,并访问私有或特定领域数据。

解决数据和大模型的桥梁

llamaindex提供了5大核心工具

  • data connectors
  • data indexs
  • engines
  • data agents
  • application integrations

大模型幻觉。模型数据的边界问题。

核心概念

llamaindex帮助构建llm驱动,基于个人或私有数据的应用。RAG(Retriveal Augmented Generation)是llamaindex应用的核心概念。

RAG

检索增强生成。利用个人或私有领域数据增强LLM的一种范式。通常包含两个阶段:

  • 索引
  • 查询

索引阶段

解析成document表现形式。 Node是llamaindex中数据的最小单元。

跟Node划分的粒度有很大关系。

查询阶段

模型大小,模型对问题的理解。知识库的内容。

Node依旧是文本,之后再变成向量。

Node需要根据数据的特点进行结构化划分。

相似度匹配。向量相似度。问题。检索器一般不去动。方法就这么几种。

Agents,最有规划,处理更复杂的任务。

大脑的角色。

lanchain:偏向复杂工作流。 llamaindex:偏向RAG框架。

个性化设置

lolamahub.ai, 找各种文件解析器