无穹玩法 | GenStudio+RAGFlow打造企业知识库

85 阅读3分钟

「无穹玩法」专栏旨在与各位读者一起探索如何借助无问芯穹大模型服务平台(GenStudio)提供的高性能推理加速API,解锁AI应用的无限可能。

大多数企业都拥有大量非结构化文档,却难以充分挖掘和利用其价值,导致知识流转缓慢、决策效率低下。例如,企业人员在准备合同时,往往需要频繁查找合同、财务和合规等资料,增加了业务沟通和决策成本。通过检索增强生成(RAG)技术,我们可以打造一个智能“企业大脑”,让知识主动服务人,实现实时的对话、精准回答。

然而,知识库构建流程复杂,涉及文档解析、分块、嵌入等环节,还要应对多种文档格式的问题。

RAGFlow作为开源RAG框架,支持pdf等多格式解析、智能分块和混合检索,简化知识库的构建和维护,提升了检索与问答的准确性。下面,我们将展示如何将无问芯穹大模型服务平台 GenStudio 集成到 RAGFlow 开源框架,打造一套高效、智能的企业级知识库解决方案。

01

RAGFlow环境部署

1. 下载源码

git clone https://github.com/infiniflow/ragflow.git

2. Docker服务准备

  • docker镜像拉取问题,在docker/.env 文件内根据变量 RAGFLOW_IMAGE 的注释提示选择国内相应镜像。
cd ragflow/dockerdocker compose -f docker-compose-macos.yml up -d

3. 服务器启动成功后再次确认服务器状态

docker logs -f ragflow-server

图片

02

在RAGFlow中配置 Genstudio 服务

RAGFlow页面中服务配置模型服务十分便捷,在模型提供商的OpenAI-API-Compatible选项下,可直接添加无问芯穹大模型服务平台(GenStudio)的chat、embedding等模型服务,分别添加以下字段。

  • 模型名称

  • 基础url

  • APIKEY

  • 最大token数

图片

无问芯穹大模型服务平台(GenStudio)提供知识库构建所需的高性能推理加速API,资源充足,确保企业知识库应用的稳定性。

LLM (大语言模型 ):基础版不计费

Embedding (向量模型):当前向量嵌入模型 API 不计费,单个APIKEY,每分钟请求次数 (RPM)=1000

Rerank API (重排模型)等:当前重排模型 API 不计费,单个APIKEY,每分钟请求次数 (RPM)=1000

图片

cloud.infini-ai.com/genstudio?s…

03

应用场景展示:企业财务报销助理

在聊天中,新建助理,以企业财务报销场景为例,定义财务助理的角色、提示词,并添加财务知识库(需提前上传文件并做好解析)

图片

设置好后,新建聊天,在RAGFlow界面中输入:“最近的一笔报销金额超过5000元,报销流程是?”。

图片

结果展示

图片

以上,通过探索无问芯穹 GenStudio API 与 RAGFlow 的集成,高效地构建了一套企业知识库检索系统,帮助企业更高效地流转和处理企业内部信息,更好地为企业日常流程提效。

无问芯穹大模型服务现已支持在多个AI应用、开发平台中使用。可在网页或本地安装以下应用,接入无问芯穹的 API 后(可自定义添加这两款模型),即可体验Qwen3、DeepSeek V3/R1、QWQ32B、Qwen2.5-VL等最新模型高性能推理加速版API

  • AI应用:Cherry Studio、LobeChat、NextChat

  • 代码应用:Cursor、Cline

  • AI应用开发平台:Dify

  • Agent项目:LangManus

  • AI 笔记:Obsidian AI

  • 翻译插件:沉浸式翻译

  • 浏览器插件:Sider、Page Assist

更多场景与应用案例接入教程可参考:docs.infini-ai.com/posts/#tag=…

欢迎更多AI应用合作伙伴加入我们,一起为开发者、企业提供更高效的智能应用。如果你还想无问芯穹大模型服务接入其他AI应用,也可以在评论区告诉我们。