推荐一个牛逼的RAG+KAG双引擎AI项目

0 阅读20分钟

前言

最近我的企业智能知识库系统升级了:增加Python版本的后端微服务。

目前包含三个项目:

  1. React前端项目
  2. Java后端项目
  3. Python后端项目

这个系统非常实用,可以直接写到简历中,很加分。

通过这个系统,大家可以前端、Java、Python和AI技术一起学习。

更多项目实战在我的技术网站:susan.net.cn/project

一、项目介绍

这个项目是干什么的?

简单说:让企业里的知识真正流动起来。

你在公司里是不是经常遇到这些情况:

  • 找一个接口文档,要翻 Confluence、语雀、飞书、本地 Markdown,最后还是问同事才找到。
  • 新同事入职,面对一片信息孤岛,没人告诉他该看什么、从哪看起。
  • 核心员工离职,人走了知识也走了,留下的文档三年没更新过。
  • 想用 AI 赋能知识管理,但市面上的 SaaS 方案要么太贵,要么数据安全过不了关。

企业智能知识库系统就是为解决这些问题而生的。

它覆盖了从文档创建、分类存储、混合智能检索、权限审批、版本管理,到 AI 智能问答、AI写作、知识图谱分析的全链路。

项目规模有多大?

维度数据
后端技术栈两套可选:Java 版 / Python 版
Java 版微服务模块10个,Java 源文件 192个
Python 版微服务模块8个,Python 源文件 120+个
REST API 端点近200个(两套后端功能对等)
前端功能页面34个
数据库(MySQL)9个,共 29 张业务表
中间件集成Java 版 7种 / Python 版 7种
后端代码量Java 版 20,000+ 行 / Python 版 15,000+ 行
前端代码量16,000+ 行 TypeScript/TSX
总代码量50,000+ 行(含两套后端)

这个项目提供了 Java 和 Python 两套后端实现,功能完全对等,你可以根据自己的技术栈偏好选择其中一套来学习和使用。

两套后端遵循相同的 REST API 规范,前端不需要改动。

系统架构一览

image.png

架构亮点: 项目提供 Java 和 Python 两套独立的后端实现

Java 版基于 Spring Cloud Alibaba 微服务体系,Python 版基于 FastAPI + LangChain。

两套后端功能对等(文档管理、搜索、AI问答、权限管控等核心能力完全一致),共享同一套前端。

根据你的团队技术栈选择一套即可,部署方案各自独立。

二、使用技术

Java后端技术栈

技术版本在项目里的实际用途
Java21 LTS虚拟线程、Record类、模式匹配
Spring Boot3.2.0所有微服务的基础框架
Spring Cloud2023.0.0微服务治理、服务间调用
Spring Cloud Alibaba2023.0.1.0Nacos 注册中心 & 配置中心集成
Spring Cloud Gateway-统一 API 网关、路由转发、CORS
MyBatis Plus3.5.8所有数据库的 ORM 操作
Druid1.2.20数据库连接池 + SQL 监控
MySQL8.09 个业务数据库,22+ 张表
Redis7.x缓存、Session、实时排行榜
Elasticsearch7.x全文检索 + 向量存储
MongoDB6.x文档正文内容存储
Neo4j5.x知识图谱节点和关系存储
RabbitMQ3.x异步消息(转码、索引同步、通知)
LangChain4j0.29.1LLM 集成框架,统一模型调用
Knife4j4.3.0自动生成 Swagger API 文档
JWT (JJWT)0.12.3无状态身份认证
Hutool5.8.24通用工具库

Python 后端技术栈

除了 Java 版之外,项目还提供了完整的 Python 版后端实现

两套后端功能对等、API 接口一致、共享同一套前端。如果你主攻 Python 方向,或者团队正在从 Java 向 Python 转型,可以直接选择这套:

技术版本在项目里的实际用途
Python3.12类型注解、match-case 模式匹配、asyncio 协程
FastAPI0.115+高性能异步 Web 框架,替代 Spring Boot,自动生成 Swagger 文档
Pydantic2.x请求/响应数据校验与模型定义,替代 Java Bean Validation
SQLAlchemy2.0+异步 ORM,替代 MyBatis Plus,管理所有业务表的 CRUD
Alembic-数据库迁移工具,替代 Flyway/Liquibase
Uvicorn + Gunicorn-ASGI 多 worker 服务器,并发模型替代 Tomcat/Nginx
FastAPI Users-JWT 认证 + RBAC 权限体系,替代 Spring Security + JJWT
LangChain0.3+LLM 统一调用编排、RAG Pipeline 构建
LangGraph0.2+多步骤 AI Agent 编排引擎,状态图驱动
OpenAI SDK1.x兼容多模型 API(通义千问 / DeepSeek / GLM-4)
Sentence-Transformers3.x本地 Embedding 模型(BGE-M3, 1024维)
Elasticsearch7.x全文检索 + 向量存储
MongoDB6.x文档正文内容 + 自动保存历史
Neo4j5.x知识图谱节点和关系存储
Redis7.x缓存、Session、Celery 消息 Broker
Celery5.4+异步任务队列(文档解析、向量嵌入、视频转码、通知推送)
RabbitMQ3.x可选的消息队列(与 Celery 互补,跨团队解耦)
httpx0.28+异步 HTTP 客户端,服务间 RPC 调用
FastStream-Kafka/RabbitMQ 事件流处理框架
tiktoken-精确 Token 计数与分块边界控制

为什么提供 Python 版? 很多团队在后端语言选型上存在分歧:Java 派看重稳定性和企业生态,Python 派看重 AI 生态和开发效率。

这个项目直接把两套都做了出来,功能完全对等、API 接口一致、共享同一个前端。

你想用 Java 就用 Java 版,想用 Python 就用 Python 版,不用纠结二选一错过什么。

前端技术栈

技术版本在项目里的实际用途
React18.3.1核心 UI 框架
TypeScript5.3.3严格模式,零类型错误
Vite5.1.0构建工具,SWC 编译,秒级热更新
Ant Design5.14.0企业级 UI 组件库,中文 locale
React Router6.22.0客户端路由 + 懒加载 + 权限守卫
Zustand4.5.0轻量级状态管理 + persist 持久化
Axios1.6.7HTTP 请求 + token 自动刷新 + 重试队列
ECharts5.6.0数据可视化图表
react-markdown9.0.1Markdown 渲染 + GFM 支持
react-syntax-highlighter16.1.1代码块语法高亮
react-pdf10.4.1PDF 在线预览
mammoth1.8.0DOCX 转 HTML 预览
xlsx0.18.5Excel 表格解析和预览

中间件 & 基础设施

image.png

三、功能介绍

这系统不是一个 CRUD 壳子。

我把最核心的功能一个一个拆开来说。

3.1 文档全生命周期管理

从一篇文档的诞生到归档,每个环节都管到了:

image.png

详细功能清单:

  • Markdown 编辑器:实时预览、代码块语法高亮、表格、数学公式、GFM 支持
  • 版本管理:每次修改自动存一版,支持版本对比和任意版本回滚
  • 审批流程:文档发布需审核,审核人可以批通过也可以驳回并给出修改意见
  • 分类体系:无限级联分类树,支持拖拽移动
  • 标签系统:灵活打标签,热门标签自动排序
  • 评论互动:可对文档评论、回复、点赞
  • 收藏 & 点赞:社区化的知识互动机制
  • 文档分享:生成带密码保护的分享链接,可设置有效期
  • PDF 导出:一键导出 Markdown → PDF
  • 文档导入:支持 Word (.docx) / Markdown (.md) / 纯文本批量导入
  • 最近访问:自动记录浏览历史,方便快速回溯
  • 草稿箱:未完成的文档自动保存为草稿

3.2 文件管理中心

统一的文件管理平台,不只是存文件,而是全格式在线预览

类别支持格式预览方式
PDF.pdfreact-pdf 渲染,支持缩放、翻页
Word.doc / .docxmammoth 转 HTML 渲染
Excel.xls / .xlsxSheetJS 解析为交互式表格
PPT.ppt / .pptx后端提取幻灯片为图片预览
Markdown.mdreact-markdown + 代码高亮
纯文本.txt等宽字体渲染
图片.png / .jpg / .gif / .bmp / .svg原生预览 + 缩略图
视频.mp4 / .avi / .mov / .mkv / .webmHTML5 Video + HLS 自适应码率
音频.mp3 / .wav / .flac / .aac / .oggHTML5 Audio 播放
压缩包.zip / .rar / .7z文件列表展示

视频文件还支持:

  • 大文件上传:最大 2GB
  • 自动 HLS 转码:FFmpeg 异步转码,生成 360p + 720p 多码率
  • 自适应码率播放:根据网络自动切换清晰度
  • SHA-256 秒传:相同文件不重复上传

3.3 智能搜索

这不是简单的数据库 LIKE 模糊查询,而是基于 Elasticsearch 的企业级搜索引擎

image.png

搜索能力:

  • 全文搜索:输入任何关键词,秒级返回匹配文档
  • 高级搜索:按分类、标签、作者、时间范围多维筛选
  • 搜索建议:输入时实时联想补全
  • 语义搜索:搜"怎么提高系统性能",能匹配到"性能优化"相关文档
  • 热词排行:展示全系统搜索最多的关键词
  • 搜索历史:自动保存,随时回顾

3.4 AI 智能助手(这是最硬核的部分)

这不是调个 API 就完事的"ChatGPT 套壳"。

这套系统实现了一整套 RAG + KAG 双引擎架构

三种对话模式,适应不同场景:

模式原理适用场景
标准对话直接调用大模型通用问答、闲聊、写作辅助
RAG 对话检索知识库中的相关文档片段,注入 Prompt"我们公司的支付接口怎么对接?"
KAG 对话结合知识图谱中的实体关系,增强上下文"支付系统和哪些系统有依赖关系?"

RAG(检索增强生成):

image.png

KAG(知识增强生成):

image.png

AI 辅助写作:

  • 生成文档摘要
  • 生成文档大纲
  • 内容扩写与润色
  • 表达优化
  • 自动添加示例

双模型支持:

  • 通义千问(qwen3-max):阿里云 DashScope API
  • DeepSeek(deepseek-chat):DeepSeek 官方 API
  • 可灵活切换,配置即可生效

3.5 知识图谱可视化

基于 Neo4j 图数据库构建知识网络,支持:

  • 节点管理:按类型(文档/用户/分类/标签)筛选
  • 关系查询:按源头/目标类型过滤
  • N 度关联:查询任意节点 2-3 跳范围内的关联
  • 路径分析:两个知识点之间的最短路径
  • 社区发现:标签传播算法,自动识别知识集群
  • 前端可视化:ECharts 力导向图渲染,支持节点拖拽、缩放、高亮

3.6 权限管理(真正的企业级 RBAC)

image.png

完整功能:

  • 用户管理(创建、禁用、删除、重置密码)
  • 角色管理(可自定义角色,灵活分配权限)
  • 权限树(细粒度控制,精确到每个操作按钮)
  • 团队管理(部门/项目组织形式,权限继承)
  • JWT 无状态认证 + Token 自动刷新
  • 全操作日志记录(谁在什么时候做了什么)

3.7 数据看板 & 统计分析

  • 总览仪表盘:文档总数、用户数、今日访问量、AI调用次数
  • 文档趋势图:按时间维度的创建/更新趋势
  • 用户活跃度排行:谁在贡献、谁在消费知识
  • 分类分布图:知识在各领域的分布情况
  • 热门文档排行:最受欢迎的技术文档 Top 10

3.8 实时通知系统

  • WebSocket 实时推送
  • RabbitMQ 异步消息处理
  • 通知保留 90 天
  • 支持已读/未读状态管理
  • 支持管理员群发通知

3.9 Python 后端实现方案

如果你选择 Python 版后端,以下是 Python 版本中几个核心模块的亮点。

功能上与 Java 版对等,但实现方式更贴合 Python 生态特点。

1. FastAPI 微服务体系

Python 版拆分为 8 个独立 FastAPI 应用,通过 Nginx 反向代理或 Traefik 做网关路由:

模块端口职责
gateway-service8000统一入口、JWT 校验、CORS、限流
auth-service8001用户认证、RBAC 权限、团队管理
document-service8002文档 CRUD、分类、标签、评论、审核
file-service8003文件上传/下载、格式转换、HLS 转码
search-service8004ES 全文检索、搜索建议、热词排行
ai-service8006RAG/KAG 对话、AI 写作、LangGraph Agent
graph-service8008Neo4j 知识图谱的节点与关系管理
statistics-service8005数据看板、定时统计、用户活跃度

所有服务通过 httpx 异步客户端做服务间调用,JWT 认证通过 FastAPI 中间件统一拦截,X-User-Id Header 透传与 Java 版设计一致。

2. 全链路 RAG Pipeline

文档入库(document-service 异步触发)
  ├── LangChain RecursiveCharacterTextSplitter 智能分块
  │   ├── 自适应语义分块(段落边界感知,非暴力截断)
  │   └── 动态 chunk_size(256~1024,根据文档类型自动调整)
  ├── Celery EmbeddingTask → Sentence-Transformers BGE-M3 本地 Embedding
  │   ├── 1024维稠密向量,支持中英双语
  │   └── GPU 加速批处理(batch_size=32)
  ├── ES dense_vector 索引写入(或可选 Milvus)
  └── 查询时:BM25 + 向量双路召回 → RRF 融合

3. LangGraph Agent 工作流

Python 版的 AI 对话不是简单的一问一答,而是通过 LangGraph 构建的多步骤自主推理链:

Agent 类型能力应用场景
SearchAgent按关键词、分类、标签检索文档"找一下支付接口文档"
RAGAgent语义检索 + LLM 生成答案"支付接口怎么对接?"
KAGAgent知识图谱遍历 + 关联推理"支付系统和哪些系统有关联?"
WritingAgent大纲生成 → 段落扩写 → 润色"帮我写一份支付系统接入指南"
SupervisorAgent调度上述 Agent,自主决策调用顺序"分析支付系统的整体架构"

所有 Agent 通过 LangGraph StateGraph 串联,支持 Checkpointer 状态持久化与断点恢复。

4. Celery 异步任务体系

Python 版用 Celery + RabbitMQ 组合,做所有耗时操作的异步解耦:

  • DocumentParseTask:Word/PDF 解析 → Markdown 转换
  • EmbeddingTask:文档分块 + 向量嵌入 → 写回向量索引
  • EntityExtractionTask:LLM 实体抽取 → Neo4j 图谱写入
  • SummaryTask:文档摘要自动生成
  • TranscodeTask:FFmpeg 视频转码(HLS 多码率)
  • IndexSyncTask:ES 全文索引同步
  • 进度推送:Celery task state → WebSocket → 前端百分比进度条

5. Model Gateway 多模型网关

┌─────────────────────────────────────────────────┐
│            FastAPI Model Gateway               │
├─────────────────────────────────────────────────┤
│  统一接口: POST /api/v1/chat/completions        │
├──────────┬──────────┬──────────┬───────────────┤
│  Qwen    │ DeepSeek │ GLM-4    │ 本地模型      │
│ (通义千问) │ (深度求索) │ (智谱)    │ (Ollama/vLLM) │
├──────────┴──────────┴──────────┴───────────────┤
│  自动 fallback:A 模型超时 → B 模型接管         │
│  智能路由:简单问答→DeepSeek / 复杂推理→Qwen     │
│  Token 计费:每次调用精确计算消耗 Token 和成本   │
│  速率控制:按模型 + 用户维度的 Token Bucket 限流 │
└─────────────────────────────────────────────────┘

四、系统展示

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

五、项目亮点

5.1 架构亮点

1. 真正的微服务落地,不是"拆模块改个名"

  • 10 个微服务独立部署,每个服务有自己的数据库(9 个独立 MySQL 库)
  • Nacos 服务注册与发现,服务间通过 Feign 声明式调用
  • Spring Cloud Gateway 统一网关,JWT 认证在网关层统一处理
  • 有明确的服务边界和调用关系,不是简单的 Maven 多模块

Gateway 的 AuthGlobalFilter 在请求进入时就完成 JWT 校验,提取用户信息后通过 X-User-Id Header 向下游透传。下游服务不再重复处理认证逻辑,只需要从 Header 中读取用户身份即可——关注点分离,代码更清爽。

服务间通信采用 Spring Cloud OpenFeign,用接口+注解的方式定义远程调用,完全不写 HTTP 连接代码。

所有 10 个服务启动后自动注册到 Nacos,支持健康检查、负载均衡、动态上下线。

2. RAG + KAG 双引擎 AI 架构

这不是简单的"接个 ChatGPT API"。

项目实现了一整套可插拔的 AI 引擎架构:

维度RAG 引擎KAG 引擎
数据来源文档内容(向量化分块)知识图谱(Neo4j实体关系)
检索方式Embedding 向量相似度 + BM25 混合检索LLM实体识别 → Neo4j 多跳遍历
核心优势语义匹配,理解用户意图结构化推理,发现隐含关联
融合策略RRF(Reciprocal Rank Fusion)加权融合,权重可调

整个 pipeline 可拆解为独立步骤:文档分块(Chunking)→ 文本嵌入(Embedding)→ 向量索引(KNN)→ 混合检索 → 上下文构造 → LLM 生成。

每一个步骤都有独立的 Service 实现,方便替换或升级。

3. 混合搜索(BM25 + 向量)

不是简单的 ES LIKE 模糊查询,而是实现了搜索结果的多路召回 + 融合排序:

用户搜索 "如何提升系统性能"
  ├── 路径1: BM25 倒排索引关键词匹配 → 命中"性能优化"文档(精确但可能遗漏同义词)
  ├── 路径2: text-embedding-v3 向量语义匹配 → 命中"系统调优"文档(语义相近但用词不同)
  └── RRF 融合: 对两路结果按倒数排名加权融合,输出 Top-K=20 最终结果

向量 embedding 采用阿里云 text-embedding-v3 模型,1024 维向量存入 Elasticsearch 的 dense_vector 字段,支持 KNN 近似最近邻检索。

用户每次搜索异步写入 MySQL,定时任务聚合计算热词排行。

搜索历史支持个人维度管理(查看/清空/导出),热词排行面向全系统展示——既保护个人隐私,又提供全局趋势洞察。

4. RabbitMQ 驱动的事件异步处理

大量耗时操作通过 RabbitMQ 异步解耦,让核心流程保持快速响应:

事件生产者消费者说明
操作日志AOP切面kb-foundation不阻塞业务请求
文档索引更新kb-documentkb-search/Consumer文档发布后异步更新 ES
RAG 向量化kb-documentkb-ai/ReindexConsumer文档发布后异步向量嵌入
KAG 图谱构建kb-documentkb-ai/KAGReindexConsumer文档发布后异步构建图谱
视频转码kb-filekb-file/TranscodeConsumer大文件转码不阻塞上传
通知推送各服务kb-foundation消息异步分发

6. 两套后端实现,自由选择

这是本项目区别于绝大多数开源项目的核心亮点——不是只有一套后端,而是 Java 和 Python 各有一套完整实现

维度Java 版Python 版
框架Spring Boot 3.2 + Spring CloudFastAPI 0.115 + LangChain
微服务模块10个8个
ORMMyBatis PlusSQLAlchemy 2.0+
认证Spring Security + JJWTFastAPI Users + PyJWT
异步任务RabbitMQCelery + Redis + RabbitMQ(Celery 做任务调度,RabbitMQ 做跨服务解耦)
数据库MySQL ×9 + MongoDB + ES + Neo4j同一套数据库,接口兼容
服务间调用OpenFeignhttpx 异步客户端
部署JAR + Docker ComposeUvicorn + Docker Compose
API 接口用同一套 Swagger 规范,接口路径和参数一致
前端共用同一套 React 前端,零改动切换

设计哲学: 大部分微服务开源项目只提供一种语言的实现,你喜欢的语言没做就只能将就。

这个项目两套都做了,功能完全对等。

你想用 Java 学习 Spring Cloud 全家桶,就用 Java 版;你想用 Python 学习 FastAPI + LangChain + AI 原生开发,就用 Python 版。

两套源码都在星球里,一次付费全部拿走。

5. 全格式文件预览体系

涵盖 PDF、DOCX、XLSX、PPT、Markdown、TXT、图片、视频(HLS)、音频,用户不需要下载文件就能看到内容。

项目覆盖了企业日常能接触到的几乎所有文件格式,且不需要用户安装任何软件:

类别支持格式预览技术关键库
PDF.pdf分页渲染,支持缩放react-pdf 10.x
Word.doc/.docxHTML 实时转换mammoth.js
Excel.xls/.xlsx交互式数据表格SheetJS (xlsx)
PPT.ppt/.pptx幻灯片逐页预览后端图片提取
Markdown.mdGFM 渲染 + 代码高亮react-markdown + PrismJS
纯文本.txt等宽字体渲染原生
图片png/jpg/gif/bmp/svg/webp缩略图 + 原图预览原生
视频mp4/avi/mov/mkv/webmHLS 自适应码率流播放FFmpeg + HTML5 Video
音频mp3/wav/flac/aac/oggHTML5 音频播放原生 Audio
压缩包zip/rar/7z文件列表展示-

视频上传后自动完成:SHA-256 完整性校验 → FFprobe 提取元数据(时长/分辨率/码率)→ 用户点击"转码"→ RabbitMQ 异步发送转码消息 → FFmpeg 生成 360p + 720p 多码率分片 → HLS .m3u8 播放列表 → 前端根据网络状况自动切换清晰度。

整个流程全异步、不阻塞用户操作,转码进度可通过 API 查询。

导入支持:Word (.docx) → Markdown, Markdown (.md) → 系统文档, 纯文本 (.txt) → 系统文档, 拖拽批量导入

导出支持:Markdown → PDF, Markdown → Word, Markdown → 原格式下载

构建了完整的文档格式转换 pipeline,知识进得来也出得去。

5.2 工程亮点

分类亮点数核心关键词
微服务架构6数据库-per-服务、Gateway鉴权透传、Feign声明式调用、Nacos注册配置、Java/Python双后端实现、功能完全对等
AI/LLM7RAG+KAG双引擎、LangChain+LangGraph Agent编排、混合检索RRF融合、LLM自动构建知识图谱、SSE流式输出、双模型切换、反馈闭环
Python 后端5FastAPI异步微服务Celery异步任务队列SQLAlchemy 2.0异步ORMSentence-Transformers本地EmbeddingModel Gateway多模型网关
搜索技术2BM25+向量混合检索+RRF融合、异步热词分析
权限安全4三层RBAC、Token刷新请求队列、防全表更新拦截器、AOP注解审计
存储文件3全格式预览矩阵、HLS自适应流媒体、SHA-256秒传去重
数据工程4Snowflake分布式ID、逻辑删除审计、消息队列事件驱动、定时统计
前端工程4Axios拦截体系、Zustand持久化、路由懒加载守卫、TS零错误
运维工程4全局异常处理、Knife4j在线文档、虚拟线程

更多项目实战在我的技术网站:susan.net.cn/project

5.3 这套源码能带给你什么?

如果你是一个 Java 后端开发:

  • 微服务怎么拆、怎么做服务发现、怎么写 Feign 接口,这项目里全有
  • JWT + RBAC 权限模型怎么设计,代码怎么写,直接看 kb-user-auth
  • MyBatis Plus 的高级用法(分页、连表、动态 SQL、逻辑删除)
  • Elasticsearch 全文检索 + 向量搜索怎么实际落地
  • RabbitMQ 异步消息怎么在真实的业务场景里用
  • AOP 切面编程实现操作日志和限流

如果你是一个 Python 后端开发:

  • FastAPI 如何构建生产级异步微服务(asyncio + Uvicorn + Gunicorn)
  • SQLAlchemy 2.0 异步 ORM 的高级用法(连表、分页、软删除、事务管理)
  • FastAPI Users + PyJWT 实现 JWT 认证 + RBAC 权限体系
  • Celery + Redis 构建异步任务队列(文档解析、向量嵌入、视频转码)
  • LangChain + LangGraph 搭建多 Agent 自主协作系统
  • Sentence-Transformers 本地 Embedding 做向量检索(GPU 批处理)
  • Model Gateway:多模型统一接口、智能路由、自动 fallback
  • httpx 异步客户端做微服务间 RPC 通信
  • Pydantic 2.x 做严格的数据校验与 API Schema 定义
  • Alembic 数据库版本迁移管理

如果你是一个前端开发:

  • React 18 + TypeScript 5 企业级项目怎么组织目录和代码
  • Zustand 状态管理 + persist 持久化的最佳实践
  • Axios 拦截器、Token 刷新、请求重试队列的完整方案
  • Ant Design 5 的深度定制(自定义主题、国际化)
  • ECharts 在 React 中怎么封装和使用
  • 文件上传(大文件分片)、文件预览(PDF/DOCX/XLSX/MD)怎么实现

如果你关注 AI / LLM:

  • RAG 完整 pipeline 的代码实现(从文档分块到向量检索到 LLM 生成)
  • KAG 完整 pipeline 的代码实现(从实体抽取到图谱构建到融合检索)
  • Java 版用 LangChain4j、Python 版用 LangChain——两种技术路线对比学习
  • Elasticsearch 向量存储的方案设计和落地
  • Neo4j 知识图谱如何由 LLM 驱动自动构建
  • 多模型(Qwen + DeepSeek)切换的架构设计

如果你是架构师或技术 Leader:

  • 微服务怎么拆,每个服务的边界如何定义
  • 9 个数据库的设计理由、ER 关系、索引策略
  • 7 种中间件的选型理由和使用场景
  • Java vs Python 技术选型:同一个系统用两种语言分别实现,你可以直接对比两种技术栈的工程差异、性能特点、开发效率,这对技术选型决策非常有参考价值