前面带领大家部署了deepseek+Dify 安装本地知识库:DeepSeek + Dify :零成本搭建企业级本地私有化知识库保姆级喂饭教程
Dify虽好,但他的知识库设置参数不够丰富和灵活,对于不同形式的文档上传,尤其是pdf扫描版,上传识别效果不好,知识库根本回答不了PDF李的内容。
今天,带大家认识一下ragflow这个知识库开原方案,针对不同场景的文档,做了深度优化,看看能不能解决大家的问题?
如果因为网络原因,下载不了镜像,可以使用文末我封装好的一键安装包,镜像都已经替大家下载好了。
只需要点击启动按钮即可等待服务启动完成,配置我已经调好了,不会和已经安装的dify冲突,不用担心启动后ragflow会对dify造成影响,获取方式在文末
一、什么是RAGFlow?
RAGFlow是一款基于深度文档理解(deepdoc)构建的开源 RAG引擎。
其中,深度文档理解,是RAGFlow对文档解析的一个解决方案,它包含两个组成部分:视觉处理和解析器。其中视觉处理是通过OCR,布局识别,表结构识别来完成图像,PDF,表格的识别的。针对PDF、DOCX、EXCEL和PPT四种文档格式,都有相应的解析器。
能够从各类复杂格式的非结构化数据中提取信息,文本切片过程可视化,还支持手动调整。支持丰富的文件类型,包括 Word 文档、PPT、excel 表格、txt 文件、图片、PDF、影印件、复印件、结构化数据、网页等。
更重要的是,他还集成了各种嵌入模型,rerank模型,提供易用的 API,可以轻松集成到各类企业系统。
安装包镜像完整下载下来,体积非常大。因此官方也提供了slim版(默认),对于电脑配置不是很高的朋友,可以选择slim版,
二、电脑配置要求
- CPU >= 4 核
- 运行内存= 16 GB
- 硬盘 >= 50 GB
- Docker >= 24.0.0 & Docker Compose >= v2.26.1
三、一键安装包获取方式
① 薇新搜索工种浩:阿坡RPA
② 点击进入
③ 关注
④ 进入聊天界面
⑤ 回复关键字:ragflow
下载链接自动掉落
如果还有疑问可ao-ai-coding联系我
四、下载项目压缩包
github下载地址:github.com/infiniflow/…
一)到github下载项目源码
二)修改配置文件
由于前面我们已经安装了Dify项目,这两个项目都依赖了redis,且web端的端口都是默认80端口,因此,为了避免冲突,我们需要修改配置文件。
1、修改web访问默认端口
修改文件位置:docker目录下的env文件
如果看不到该文件,请将资源管理器查看设置改为显示隐藏的项目:查看-》下你是-》勾选 隐藏的项目
2、修改redis配置
五、启动服务
进入docker目录,右键打开命令行:
输入命令:
docker compose up -d
六、打开浏览器访问
由于前面,我们把web端口设置为了90端口,docker镜像拉取后,等待容器启动完成,在浏览器输入: 127.0.0.1:90 即可访问