RagFlow: 一文读懂RAGFlow：从 0 到 1教你搭建RAG知识库本文介绍了 RAGFlow 的基础使用方法，

RAGflow 项目介绍

RAGflow 是一款基于 "深度文档理解" 构建的开源 RAG(Retrieval-Augmented Generation)引擎。
它可以为各种不同规模的项目, 提供一套精简通用的 RAG 工作流程，
结合 LLM(大语言模型) 针对用户的各类不同的复杂格式数据, 提供 "可靠的问答" 和 "有理有据的引用"。

本文将详细介绍 RAGflow 项目，并提供快速入门指南，同时也会从源码层面对 RAGflow 项目进行简要解析，从而可以对 RAGflow 项目有一个全面的了解。

RAGflow 核心功能介绍
RAGflow 是一个集成化、模块化的 RAG 框架，
它结合了最新的检索技术、LLM(大型语言模型)、支持多种类型的数据格式解析、多样的切片&索引构建策略，
以提高 "生成内容的质量和关联性"，同时还支持基于 Graph 的 Agent 工作流构建，
端到端提供检索增强问答等能力。
具体来说，RAGflow 的核心功能包括：
- 高质量的文档提取：支持多种格式的文档，确保准确的信息抽取
- 基于模板，支持各类切片模式：灵活适应不同场景的数据分割需求
- 可视化，检索内容支持溯源，切片透明：提高系统的可解释性和可信度
- 支持多种类型的数据源：适应各种数据环境，提高系统的通用性
- 支持多种模型对接：兼容不同的语言模型，满足多样化的应用需求
- 提供各类API：便于集成到现有系统中，提高开发效率
- 多路召回，融合重排序：提高检索精度和相关性
- 支持Graph定制工作流：实现复杂的智能交互和决策流程
系统架构
RAGflow 整体的系统架构图如下：

环境准备与系统搭建

环境需求

在搭建RAGFlow系统前，需要确保开发与运行环境满足以下要求：

• 硬件配置：建议采用多核CPU、充足内存（16GB及以上）以及支持高并发访问的存储设备；如需部署大规模检索服务，可考虑使用分布式存储集群。
• 操作系统：推荐使用Linux发行版（如CentOS、Ubuntu）以便于Shell脚本自动化管理；同时也支持Windows环境，但在部署自动化脚本时可能需要适当调整。
• 开发语言与工具：主要使用Java进行系统核心模块开发，同时结合Shell脚本实现自动化运维。
• 依赖环境：需要安装Java 8及以上版本，同时配置Maven或Gradle进行依赖管理；对于数据检索部分，可采用ElasticSearch、Apache Solr等开源检索引擎；生成模块则依赖于预训练模型，可以借助TensorFlow或PyTorch进行实现。

服务器配置

• CPU >= 4 核
• RAM >= 16 GB
• Disk >= 50 GB
• Docker >= 24.0.0 & Docker Compose >= v2.26.1

安装

修改 max_map_count

确保 vm.max_map_count 不小于 262144

如需确认 vm.max_map_count 的大小：

$ sysctl vm.max_map_count

如果 vm.max_map_count 的值小于 262144，可以进行重置：

# 这里我们设为 262144:
$ sudo sysctl -w vm.max_map_count=262144

你的改动会在下次系统重启时被重置。如果希望做永久改动，还需要在 /etc/sysctl.conf 文件里把 vm.max_map_count 的值再相应更新一遍：

vm.max_map_count=262144

下载仓库代码

git clone https://github.com/infiniflow/ragflow.git

Docker拉取镜像

修改镜像为国内镜像并且选择embedding版本

修改文件docker/.env/

默认配置为：RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0-slim

修改为国内镜像：RAGFLOW_IMAGE=registry.cn-hangzhou.aliyuncs.com/infiniflow/ragflow:v0.16.0

RAGFlow image tag	Image size (GB)	Has embedding models?	Stable?
v0.16.0	≈9	✔️	Stable release
v0.16.0-slim	≈2	❌	Stable release
nightly	≈9	✔️	Unstable nightly build
nightly-slim	≈2	❌	Unstable nightly build

运行命令拉取镜像

docker compose -f docker/docker-compose.yml up -d

查看日志

docker logs -f ragflow-server

提示下面提示说明启动成功

     ____   ___    ______ ______ __
    / __ \ /   |  / ____// ____// /____  _      __
   / /_/ // /| | / / __ / /_   / // __ | | /| / /
  / _, _// ___ |/ /_/ // __/  / // /_/ /| |/ |/ /
 /_/ |_|/_/  |_|____//_/    /_/ ____/ |__/|__/

 * Running on all addresses (0.0.0.0)
 * Running on http://127.0.0.1:9380
 * Running on http://x.x.x.x:9380
 INFO:werkzeug:Press CTRL+C to quit

访问IP，进入 RAGFlow，注意不是 9380 端口，Web是http://127.0.01默认为 80 端口

应用

注册账号

注册完直接登录

添加模型

**本文用到的模型类型：Chat 和 Embedding。**Rerank 模型等后续在详细介绍。

点击右上角->模型提供商->添加模型

填写模型信息，模型类型选 chat

再添加一个 Embedding 模型用于知识库的向量转换（RAGFlow 默认也有 Embedding）

在系统模型设置中配置聊天模型和嵌入模型为我们刚刚添加的模型

创建知识库

填写相关配置

• 文档语言：中文
• 嵌入模型：选择我们自己运行的bge-m3:latest,也可以用默认的。具体效果大家自行评估

上传文件

这里我自己造了一个测试文档来验证知识库，内容是编的，介绍一个 ABCD 工具，文档在文末提供下载。

文件上传后是未解析状态，需要解析才可以使用，点击解析

解析成功后点击文件可以看到解析效果

效果

创建聊天

设置模型。token 调整大一些

验证效果

问题一：直接发送 ABCD

知识库回答

原文档

问题二：ABCD 错误代码有哪些

知识库回答

原文档

问题三：ABCD 支持哪些系统

知识库回答

原文档

问题四：ABCD 官网

知识库回答

你也可以在回答的结果看到他引用的知识库

原文档

总结

本文介绍了 RAGFlow 的基础使用方法，从演示效果来看尚可。然而，在实际应用场景中，各类文件格式与结构各不相同，文件解析成为一大难题。一旦解析不准确，即便使用性能强劲的 Deepseek-R1 大模型（经亲测），也会出现分析错误的情况。因此，在 RAG 过程中，文件解析、Embedding 以及 LLM 是提升准确率的三大关键攻克点。

原文地址：https://mp.weixin.qq.com/s/QmCr8ont0NNJl9Ft1hBttA