【学习笔记】L1G4000 InternLM + LlamaIndex RAG 实践

32 阅读1分钟

1. 什么是RAG?

检索增强生成(Retrieval Augmented Generation,RAG),主要用于给模型注入新知识。其采用的方式是不改变模型的权重,只是给模型引入格外的信息。类比人类编程的过程,第一种方式相当于你记住了某个函数的用法,第二种方式相当于你阅读函数文档然后短暂的记住了某个函数的用法。

image.png

2. 任务

基于 LlamaIndex 构建自己的 RAG 知识库,寻找一个问题 A 在使用 LlamaIndex 之前 浦语 API 不会回答,借助 LlamaIndex 后 浦语 API 具备回答 A 的能力,截图保存。

3. 实践结果

  1. 使用LlamaIndex 之前 由于InternLM2.5已经支持了任务中提供的xturner数据,所以提供demo运行后可以正确回复

screenshot_2025-01-14_22-52-53.png

image.png

  1. 使用 LlamaIndex 后 按照任务描述步骤,进行各种库安装后,使用LlamaIndex后,生成结果如下:

screenshot_2025-01-14_22-50-22.png

相关链接

GitHub - InternLM/xtuner: An efficient, flexible and full-featured toolkit for fine-tuning LLM (InternLM2, Llama3, Phi3, Qwen, Mistral, ...) Tutorial/docs/L1/LlamaIndex/readme_api.md at camp4 · InternLM/Tutorial · GitHub