「无穹玩法」专栏旨在与各位读者一起探索如何借助无问芯穹大模型服务平台(GenStudio)提供的高性能推理加速API,解锁AI应用的无限可能。
大多数企业都拥有大量非结构化文档,却难以充分挖掘和利用其价值,导致知识流转缓慢、决策效率低下。例如,企业人员在准备合同时,往往需要频繁查找合同、财务和合规等资料,增加了业务沟通和决策成本。通过检索增强生成(RAG)技术,我们可以打造一个智能“企业大脑”,让知识主动服务人,实现实时的对话、精准回答。
然而,知识库构建流程复杂,涉及文档解析、分块、嵌入等环节,还要应对多种文档格式的问题。
RAGFlow作为开源RAG框架,支持pdf等多格式解析、智能分块和混合检索,简化知识库的构建和维护,提升了检索与问答的准确性。下面,我们将展示如何将无问芯穹大模型服务平台 GenStudio 集成到 RAGFlow 开源框架,打造一套高效、智能的企业级知识库解决方案。
01
RAGFlow环境部署
1. 下载源码
git clone https://github.com/infiniflow/ragflow.git
2. Docker服务准备
- docker镜像拉取问题,在docker/.env 文件内根据变量 RAGFLOW_IMAGE 的注释提示选择国内相应镜像。
cd ragflow/dockerdocker compose -f docker-compose-macos.yml up -d
3. 服务器启动成功后再次确认服务器状态
docker logs -f ragflow-server
02
在RAGFlow中配置 Genstudio 服务
RAGFlow页面中服务配置模型服务十分便捷,在模型提供商的OpenAI-API-Compatible选项下,可直接添加无问芯穹大模型服务平台(GenStudio)的chat、embedding等模型服务,分别添加以下字段。
-
模型名称
-
基础url
-
APIKEY
-
最大token数
无问芯穹大模型服务平台(GenStudio)提供知识库构建所需的高性能推理加速API,资源充足,确保企业知识库应用的稳定性。
LLM (大语言模型 ):基础版不计费
Embedding (向量模型):当前向量嵌入模型 API 不计费,单个APIKEY,每分钟请求次数 (RPM)=1000
Rerank API (重排模型)等:当前重排模型 API 不计费,单个APIKEY,每分钟请求次数 (RPM)=1000
cloud.infini-ai.com/genstudio?s…
03
应用场景展示:企业财务报销助理
在聊天中,新建助理,以企业财务报销场景为例,定义财务助理的角色、提示词,并添加财务知识库(需提前上传文件并做好解析) 。
设置好后,新建聊天,在RAGFlow界面中输入:“最近的一笔报销金额超过5000元,报销流程是?”。
结果展示
以上,通过探索无问芯穹 GenStudio API 与 RAGFlow 的集成,高效地构建了一套企业知识库检索系统,帮助企业更高效地流转和处理企业内部信息,更好地为企业日常流程提效。
无问芯穹大模型服务现已支持在多个AI应用、开发平台中使用。可在网页或本地安装以下应用,接入无问芯穹的 API 后(可自定义添加这两款模型),即可体验Qwen3、DeepSeek V3/R1、QWQ32B、Qwen2.5-VL等最新模型高性能推理加速版API。
-
AI应用:Cherry Studio、LobeChat、NextChat
-
代码应用:Cursor、Cline
-
AI应用开发平台:Dify
-
Agent项目:LangManus
-
AI 笔记:Obsidian AI
-
翻译插件:沉浸式翻译
-
浏览器插件:Sider、Page Assist
更多场景与应用案例接入教程可参考:docs.infini-ai.com/posts/#tag=…
欢迎更多AI应用合作伙伴加入我们,一起为开发者、企业提供更高效的智能应用。如果你还想无问芯穹大模型服务接入其他AI应用,也可以在评论区告诉我们。