[笔记][大模型学习]20-llama-index核心组件大模型应用微调功能：能够让现有的开源大模型理解我们自己的

大模型应用

微调
- 功能：能够让现有的开源大模型理解我们自己的（私有化）数据。
- 特点：需要做模型的二次训练（成本，风险）
- 应用场景：当需要去改变大模型自身特性时，就得用微调（风格），微调本身调整的是大模型的风格，而不是大模型的能力（智商）。另外可以加强大模型对当前私有化数据的理解。
RAG
- 功能：能够让现有的开源大模型理解我们自己的（私有化）数据。
- 特点：相对微调来讲，成本更低，风险更小。
- 应用场景：事前不训练模型，但需要让模型直接根据我们的数据来进行作答。
  - 如果不涉及模型回答风格，仅需模型对当下的私有化数据做出回答，那么就用RAG;如果涉及到大模型回答风格，或者当前模型对私有数据理解不够准确，再用模型微调技术。

Llama index

llamainde是一个用于llm应用程序的数据框架，用于注入，结构化，并访问私有或特定领域数据。

解决数据和大模型的桥梁

大模型幻觉。模型数据的边界问题。

llamaindex帮助构建llm驱动，基于个人或私有数据的应用。RAG（Retriveal Augmented Generation）是llamaindex应用的核心概念。

检索增强生成。利用个人或私有领域数据增强LLM的一种范式。通常包含两个阶段：

解析成document表现形式。 Node是llamaindex中数据的最小单元。

跟Node划分的粒度有很大关系。

模型大小，模型对问题的理解。知识库的内容。

Node依旧是文本，之后再变成向量。

Node需要根据数据的特点进行结构化划分。

相似度匹配。向量相似度。问题。检索器一般不去动。方法就这么几种。

Agents,最有规划，处理更复杂的任务。

大脑的角色。

lanchain:偏向复杂工作流。 llamaindex：偏向RAG框架。

lolamahub.ai, 找各种文件解析器