无穹玩法 | GenStudio+RAGFlow打造企业知识库大多数企业都拥有大量非结构化文档，却难以充分挖掘和利用其价

「无穹玩法」专栏旨在与各位读者一起探索如何借助无问芯穹大模型服务平台（GenStudio）提供的高性能推理加速API，解锁AI应用的无限可能。

大多数企业都拥有大量非结构化文档，却难以充分挖掘和利用其价值，导致知识流转缓慢、决策效率低下。例如，企业人员在准备合同时，往往需要频繁查找合同、财务和合规等资料，增加了业务沟通和决策成本。通过检索增强生成（RAG）技术，我们可以打造一个智能“企业大脑”，让知识主动服务人，实现实时的对话、精准回答。

然而，知识库构建流程复杂，涉及文档解析、分块、嵌入等环节，还要应对多种文档格式的问题。

RAGFlow作为开源RAG框架，支持pdf等多格式解析、智能分块和混合检索，简化知识库的构建和维护，提升了检索与问答的准确性。下面，我们将展示如何将无问芯穹大模型服务平台 GenStudio 集成到 RAGFlow 开源框架，打造一套高效、智能的企业级知识库解决方案。

RAGFlow环境部署

1. 下载源码

git clone https://github.com/infiniflow/ragflow.git

2. Docker服务准备

cd ragflow/dockerdocker compose -f docker-compose-macos.yml up -d

3. 服务器启动成功后再次确认服务器状态

docker logs -f ragflow-server

在RAGFlow中配置 Genstudio 服务

RAGFlow页面中服务配置模型服务十分便捷，在模型提供商的OpenAI-API-Compatible选项下，可直接添加无问芯穹大模型服务平台（GenStudio）的chat、embedding等模型服务，分别添加以下字段。

无问芯穹大模型服务平台（GenStudio）提供知识库构建所需的高性能推理加速API，资源充足，确保企业知识库应用的稳定性。

LLM (大语言模型 )：基础版不计费

Embedding (向量模型）：当前向量嵌入模型 API 不计费，单个APIKEY，每分钟请求次数（RPM）=1000

Rerank API (重排模型)等：当前重排模型 API 不计费，单个APIKEY，每分钟请求次数（RPM）=1000

应用场景展示：企业财务报销助理

在聊天中，新建助理，以企业财务报销场景为例，定义财务助理的角色、提示词，并添加财务知识库（需提前上传文件并做好解析） 。

设置好后，新建聊天，在RAGFlow界面中输入：“最近的一笔报销金额超过5000元，报销流程是？”。

结果展示

以上，通过探索无问芯穹 GenStudio API 与 RAGFlow 的集成，高效地构建了一套企业知识库检索系统，帮助企业更高效地流转和处理企业内部信息，更好地为企业日常流程提效。

无问芯穹大模型服务现已支持在多个AI应用、开发平台中使用。可在网页或本地安装以下应用，接入无问芯穹的 API 后（可自定义添加这两款模型），即可体验Qwen3、DeepSeek V3/R1、QWQ32B、Qwen2.5-VL等最新模型高性能推理加速版API。

更多场景与应用案例接入教程可参考：docs.infini-ai.com/posts/#tag=…

欢迎更多AI应用合作伙伴加入我们，一起为开发者、企业提供更高效的智能应用。如果你还想无问芯穹大模型服务接入其他AI应用，也可以在评论区告诉我们。