首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
造轮子的猪
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
6
文章 6
沸点 0
赞
6
返回
|
搜索文章
造轮子的猪
10天前
关注
知识库-向量化功能-EXCEL文件向量化
知识库-向量化功能-EXCEL文件向量化 一、功能概述 基于Alibaba EasyExcel实现Excel文件全量解析,适配 .xls/.xlsx 双格式,核心流程为:解...
0
评论
分享
造轮子的猪
11天前
关注
知识库RAG基础架构
知识库RAG基础架构介绍(Spring AI + Elasticsearch + Ollama) 一、架构概述 本架构基于Spring AI、Elasticsearch 8...
1
评论
分享
造轮子的猪
11天前
关注
知识库-向量化功能-混合查询
知识库-向量化功能-混合查询 一、功能目标 基于 Elasticsearch 8.8+ 实现 BM25(关键词检索)+ 向量相似度(kNN) 混合检索,通过 Rank Fu...
0
评论
分享
造轮子的猪
15天前
关注
知识库-向量化功能-流式分片
知识库-向量化功能-流式分片 一、设计背景 针对超大文本(如100MB以上纯文本文件),传统“一次性加载全部文本到内存再分片”的方式易导致内存溢出、方法卡死等问题。因此采用...
0
评论
分享
造轮子的猪
16天前
关注
知识库-向量化功能-PDF文件向量化
知识库-向量化功能-读取PDF文件内容的方法 一、核心逻辑 基于Apache PDFBox组件解析PDF文件,仅提取原生文本内容(不处理图片、扫描件,也不涉及OCR光学字符...
0
评论
分享
造轮子的猪
17天前
关注
知识库-向量化功能-Word文件向量化
知识库-向量化功能-读取Word文件内容的方法 一、核心逻辑 采用Apache POI组件解析Word文件,区分.doc(旧版二进制格式)和.docx(新版XML格式)两种...
0
评论
分享
造轮子的猪
18天前
关注
知识库-向量化功能-文本文件向量化
知识库-向量化功能-文本文件向量化 一、核心逻辑 基于句子结束符的智能分片策略 按句子结束符(。!?;\n\.!?;)分割文本,保证分片语义完整性; 对每个文本分片独立向量...
0
评论
分享
造轮子的猪
21天前
关注
知识库-向量化功能-环境配置
知识库-向量化功能-环境配置 一、功能概述 本功能支持读取上传的PDF、Word、TXT格式文本文件,通过文本嵌入模型将文本转换为向量数据,并将原始文本与向量数据存储至El...
0
评论
分享
个人成就
文章被点赞
2
文章被阅读
641
掘力值
288
关注了
2
关注者
2
收藏集
0
关注标签
48
加入于
2022-08-01