首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
RAG
深度学习机器
创建于2024-04-13
订阅专栏
基于LLM的检索增强生成技术
暂无订阅
共32篇文章
创建于2024-04-13
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
PostgreSQL 数据库向量化的核心:pgvector
pgvector是一款开源的向量搜索引擎,除了具备所有Postgres数据库的特性外,最主要的特点是能在Postgres数据库存储和检索向量数据,支持向量的精确检索和模糊检索。
PGML:向量数据库内一体化的RAG框架
pgml是一款开源的postgres数据库插件,具备数据库中进行的ai和ml分析; 支持gpu加速;集成多种开源llm和rag框架;支持传统的机器学习模型等特性。
Chunkr: 在线PDF文档解析与OCR工具
Chunkr是一个在线的pdf文档解析和OCR工具,提供了一定的免费使用额度。并且官方还提供了开源社区版本,可以自行部署。
大模型RAG应用开发之PDF解析工具对比
非扫描件无OCR要求直接使用pymupdf(fitz)即可,能正确保留双列布局的文本顺序,同时能提取表格和图片,而且表格是以List的格式保留。其余几个传统的PDF解析库倾向于对pdf进行编辑。
Magic-PDF:端到端PDF文档解析神器 构建高质量RAG必备!
无论是可编辑的PDF还是扫描版的PDF,都能非常好的区分出版面中不同类型的部分,而且最终的结果是以Markdown的格式保存的,可以很容易把不同章节、不同自然段按需进行切分。
RAG文档解析利器:Deepdoc
Deepdoc是RAG框架RAGFLOW中使用的文档解析工具。 核心组件:OCR 版面结构分析 表格结构识别 解析器 解析器
DB-GPT:LLM应用的集大成者
可以说现有的大模型应用已经离不开Agent,Agent包含的几大核心模块基本已经固定下来,剩下的工作就是如何简化Agent的工作流、自定义工作流编排、Agent执行过程可控等。
基于Sentence Transformer微调向量模型
Sentence Transformer库升级到了V3,其中对模型训练部分做了优化,使得模型训练和微调更加简单了
热门开源Text2SQL框架
收集了一些开源的Text2sql框架,基于大语言模型驱动,支持SQL生成、数据分析、报表生成以及数据库管理等功能。
开源RAG框架汇总
本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架
【高级RAG技巧】使用二阶段检索器平衡检索的效率和精度
之前的文章已经介绍过向量数据库在RAG(Retrieval Augmented Generative)中的应用,本文将会讨论另一个重要的工具-Embedding模型。
【高级RAG技巧】在大模型知识库问答中增强文档分割与表格提取
openparse这个库算是目前开源社区中比较优秀的文档分割处理库了,功能虽然全面,还是还有不少可以优化的地方,后续也会支持其他向量化模型,并且可以跟LlamaindexLangchain等框架无缝衔
向量数据库之Lancedb学习记录
Lancedb是一个用于人工智能的开源矢量数据库,旨在存储、管理、查询和检索大规模多模式数据的嵌入。