首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
RAG基础架构+知识库+AI智能体
造轮子的猪
创建于2025-12-29
订阅专栏
RAG基础架构+知识库+AI智能体
等 3 人订阅
共17篇文章
创建于2025-12-29
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
知识库RAG基础架构
知识库RAG基础架构介绍(Spring AI + Elasticsearch + Ollama) 一、架构概述 本架构基于Spring AI、Elasticsearch 8.11.4、Ollama三大
知识库-向量化功能-环境配置
知识库-向量化功能-环境配置 一、功能概述 本功能支持读取上传的PDF、Word、TXT格式文本文件,通过文本嵌入模型将文本转换为向量数据,并将原始文本与向量数据存储至Elasticsearch(ES
知识库-向量化功能-文本文件向量化
知识库-向量化功能-文本文件向量化 一、核心逻辑 基于句子结束符的智能分片策略 按句子结束符(。!?;\n\.!?;)分割文本,保证分片语义完整性; 对每个文本分片独立向量化 分片后批量存储至Elas
知识库-向量化功能-Word文件向量化
知识库-向量化功能-读取Word文件内容的方法 一、核心逻辑 采用Apache POI组件解析Word文件,区分.doc(旧版二进制格式)和.docx(新版XML格式)两种后缀,分别适配对应的解析工具
知识库-向量化功能-PDF文件向量化
知识库-向量化功能-读取PDF文件内容的方法 一、核心逻辑 基于Apache PDFBox组件解析PDF文件,仅提取原生文本内容(不处理图片、扫描件,也不涉及OCR光学字符识别),解析后对文本做格式化
知识库-向量化功能-EXCEL文件向量化
知识库-向量化功能-EXCEL文件向量化 一、功能概述 基于Alibaba EasyExcel实现Excel文件全量解析,适配 .xls/.xlsx 双格式,核心流程为:解析Excel单元格数据 →
知识库-向量化功能-流式分片
知识库-向量化功能-流式分片 一、设计背景 针对超大文本(如100MB以上纯文本文件),传统“一次性加载全部文本到内存再分片”的方式易导致内存溢出、方法卡死等问题。因此采用流式分片策略:逐批次读取文本
知识库-向量化功能-混合查询
知识库-向量化功能-混合查询 一、功能目标 基于 Elasticsearch 8.8+ 实现 BM25(关键词检索)+ 向量相似度(kNN) 混合检索,通过 Rank Fusion(RRF)算法融合两
知识库-向量化功能-混合查询(性能优化版)
知识库-向量化功能-混合查询(性能优化版) 一、功能概述 基于 Elasticsearch 8.8+ 原生混合检索语法 重构实现「BM25关键词检索 + kNN向量语义检索」一体化查询,对比传统手动R
RAG基础架构-基础对话模型接入与使用
RAG基础架构-基础对话模型接入与使用 一、功能概述 基于Spring AI + Ollama实现本地大模型对话能力快速接入,零代码侵入适配Spring生态,开箱即用完成用户提问 → 模型生成 → 结
基于知识库的知策智能体
基于知识库的知策智能体 一、核心设计理念 知策智能体采用经典四阶段Agent架构,实现「用户问题→智能决策→工具调用→答案生成」的完整链路,各组件职责单一、解耦设计,可独立扩展/替换: 思考器(Thi
知策Agent问答 VS 知识库内容投喂AI问答
知策Agent问答 VS 知识库内容投喂AI问答 | 核心差异全解析(附选型建议) 一、两种方案「核心执行链路」直观对比 ▶ 方案1:【Agent智能体问答】(你当前实现的方案) 完整执行链路 核心特
AgentThinker 改造完整版 | 原生Function Calling调用升级
AgentThinker 改造完整版 | 原生Function Calling调用升级 一、改造核心说明:为什么要升级为Function Calling? Function Calling 核心优势(
RAG知识库增强|MinIO集成完整方案
RAG知识库增强|MinIO集成完整方案 一、改造核心价值 将MinIO集成到RAG知识库架构中,解决知识库文件存储、访问、溯源三大核心问题,核心价值如下: 替代本地文件存储,实现知识库文件的分布式、
RAG基础架构升级|Redis集成多轮对话能力
RAG基础架构升级|Redis集成多轮对话能力 一、改造核心价值 基于Redis实现会话记忆体+多轮对话上下文管理,为原有RAG架构补齐核心能力短板,完美适配智能体多轮交互场景,核心优势如下: 基于R
RAG知识库核心优化|基于语义的智能文本切片方案(对比字符串长度分割)
RAG知识库核心优化|基于语义的智能文本切片方案(对比字符串长度分割) 一、改造核心价值 传统的「按字符串长度硬分割」会破坏文本语义完整性,导致切片内容碎片化、检索答非所问;而基于语义的智能切片以完整
RAG核心升级|多LLM模型动态切换方案
RAG核心升级|多LLM模型动态切换方案 一、多模型切换核心价值 传统RAG架构绑定单一LLM模型,无法适配多样化的问答场景;而多模型动态切换方案可根据场景/需求灵活选择最优模型,核心价值如下: 场景