MaxKB4j — 基于 Java 的开源 RAG 知识库与 LLM 工作流平台

184 阅读4分钟

🧠 MaxKB4j — 基于 Java 的开源 RAG 知识库与 LLM 工作流平台

MaxKB4j = Max Knowledge Base for Java
一个开箱即用、安全可靠、模型中立的 RAG(检索增强生成)+ LLM 工作流引擎,专为构建企业级智能问答系统而设计。 广泛应用于 智能客服、企业内部知识库、数据分析、学术研究与教育等场景。

在这里插入图片描述


✨ 核心特性

🔍 开箱即用的知识库问答

  • 支持 上传本地文档(PDF/Word/TXT/Markdown 等)或 自动爬取网页内容
  • 自动完成:文本分段 → 向量化 → 存入向量数据库 → 构建 RAG 流程
  • 显著减少大模型“幻觉”,提升回答准确性与可信度

🌐 模型中立,灵活对接

支持各类主流大模型,包括:

  • 本地私有模型:DeepSeek-R1、Llama 3、Qwen 2 等(通过 Ollama / LM Studio / vLLM)
  • 国内公有模型:通义千问、腾讯混元、字节豆包、百度千帆、智谱 GLM、Kimi
  • 国际公有模型:OpenAI (GPT)、Anthropic (Claude)、Google (Gemini)

只需配置 API Key 或本地端点,即可无缝切换模型!

⚙️ 可视化工作流编排

  • 内置 低代码 AI 工作流引擎,支持条件分支、函数调用、多轮对话记忆
  • 提供丰富 内置函数库(HTTP 请求、数据库查询、时间处理、正则提取等)
  • 适用于复杂业务场景:客服工单生成、数据报告解读、内部制度问答等

🧩 无缝嵌入现有系统

  • 提供 RESTful API前端嵌入组件(iframe / Web SDK)
  • 无需改造原有系统,5 分钟集成智能问答能力

🤖 MCP Server 支持(Model Context Protocol)

  • 支持 MCP 协议,让 AI 理解代码上下文、项目结构、依赖关系
  • 不再只是“聊天机器人”,而是真正的 AI 编程协作者

🎙️ 多模态扩展(规划中)

  • 已支持:语音识别(ASR)、语音合成(TTS)、图像识别(OCR)、图像生成(Stable Diffusion)
  • 视频生成模型支持正在开发中…

🚀 快速开始

1. 环境要求

  • Java 17+
  • Maven 或 Gradle
  • PostgreSQL 12+(启用 pgvector 扩展)
  • MongoDB 6.0+(可选,用于全文检索)

2. 启动服务

# 启动应用
java -jar MaxKB4j.jar

3. 基于Docker 部署

docker run --name maxkb4j -d --restart always -p 8080:8080 -e SPRING_DATASOURCE_URL=jdbc:postgresql://localhost:5432/MaxKB4j -e SPRING_DATASOURCE_USERNAME=postgres   -e SPRING_DATASOURCE_PASSWORD=123456  -e SPRING_DATA_MONGODB_URI=mongodb://admin:123456@localhost:27017/MaxKB4j?authSource=admin  registry.cn-hangzhou.aliyuncs.com/tarzanx/maxkb4j:2.0

其中,-p 8080:8080 中的第一个 8080 是宿主机的端口,-e SPRING_DATASOURCE_URL=jdbc:postgresql://localhost:5432/MaxKB4j -e SPRING_DATASOURCE_USERNAME=postgres -e SPRING_DATASOURCE_PASSWORD=123456 是PostgreSQL数据库的连接配置参数,-e SPRING_DATA_MONGODB_URI=mongodb://admin:123456@localhost:27017/MaxKB4j?authSource=admin是MongoDB的连接配置参数, 可以根据需要进行修改。

4. Docker-Compose 部署(推荐)

# docker-compose.yml 示例见项目根目录
docker-compose up -d

5. 访问 Web 界面

首次启动会自动初始化数据库(PostgreSQL + MongoDB),请确保端口未被占用。


🛠 技术栈

类别技术
后端Java 17, Spring Boot 3, Sa-Token(鉴权)
AI 框架LangChain4j
向量数据库PostgreSQL 15 + pgvector
全文检索MongoDB
缓存Caffeine
前端Vue 3, Node.js v20.16.0

📸 UI 展示

在这里插入图片描述

更多界面请参考项目 Wiki 或实际部署体验。


❓ 问题与建议

欢迎提交 Issue 或 PR!
👉 Gitee Issues


📜 许可证

Copyright © 2025–2035 洛阳泰山 TARZAN. All rights reserved.

根据GNU通用公共许可证版本3 (GPLv3)(“许可证”)进行许可;除非遵守许可,否则您不得使用此项目文件。您可以从以下网址获得许可证的副本

🔗https://www.gnu.org/licenses/gpl-3.0.html

除非适用法律要求或经书面同意,依据本许可分发的软件均按“原样”提供,不附带任何形式的明示或暗示的担保或条件。有关许可下具体权限和限制的条款,请参见本许可协议。


🔗 相关资源

🎯 看看这个!👉 点击了解 AI 大模型应用开发实战!🔥


MaxKB4j — 让每个 Java 团队都能轻松构建企业级 AI 知识库!

🔗项目开源地址gitee.com/taisan/MaxK…