首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
RAG从入门到精通
舒一笑不秃头
创建于2025-06-01
订阅专栏
RAG从入门到精通
等 13 人订阅
共14篇文章
创建于2025-06-01
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Building effective agents 建立有效的agents
Building effective agents 建立有效的agents What are agents? 什么是代理? “Agent” 有多种定义。一些客户将Agent定义为完全自主的系统,能够在
基础RAG实现,最佳入门选择(十二)
自适应检索助力增强型RAG系统 实现一个自适应检索系统,该系统可根据查询类型动态选择最合适的检索策略。这种方法显著提升RAG系统针对各种不同问题提供准确且相关回复的能力。 不同的问题需要不同的检索策略
基础RAG实现,最佳入门选择(十一)
RAG中的反馈循环 实现一个带有反馈循环机制的RAG系统,该机制随着时间的推移不断改进。通过收集和整合用户反馈,系统学会了在每次交互中提供更相关和更高质量的响应。传统的RAG系统是静态的——它们仅基于
基础RAG实现,最佳入门选择(十)
RAG系统的上下文压缩 在为RAG检索文档时,经常会得到包含相关和不相关信息的块。上下文压缩帮助我们: -删除不相关的句子和段落 -只关注与查询相关的信息 -最大化我们上下文窗口中的有用信号 具体代码
基础RAG实现,最佳入门选择(九)
RAG的相关段提取(RSE) 关键概念 相关的块往往在文档中聚集在一起。通过识别这些集群并保持它们的连续性,我们为LLM提供了更连贯的上下文来使用。 在RSE(Relevant Segment Ext
基础RAG实现,最佳入门选择(八)
RAG重排序 RAG重排序技术以提高RAG系统中的检索质量。重新排序充当初始检索后的第二个过滤步骤,以确保最相关的内容用于响应生成。 重排序的关键概念 1.初始检索:使用基本相似度搜索的第一遍(准确度
基础RAG实现,最佳入门选择(七)
增强型RAG系统的查询转换 采用三种查询转换技术,以提高RAG系统中的检索性能,而无需依赖于像LangChain这样的专门库。通过修改用户查询,我们可以显著提高检索信息的相关性和全面性。 关键转换技术
基础RAG实现,最佳入门选择(六)
带有问题生成的文档增强RAG 具体实现步骤 1.数据摄取:从PDF文件中提取文本。 2.chunking:将文本拆分为可管理的块。 3.问题生成:为每个块生成相关问题。 4.Embedding Cre
基础RAG实现,最佳入门选择(五)
上下文标头在RAG中使用 具体操作步骤 1.数据摄取:加载和预处理文本数据。 2.带有上下文标头的组块:提取部分标题并将其添加到组块中。 3.嵌入创建:将上下文增强的块转换为数字表示。 4.语义搜索:
基础RAG实现,最佳入门选择(四)
下述方法从 PDF 提取文本、生成带重叠内容的文本块、创建文本嵌入向量、结合邻居块的上下文感知检索、基于检索内容生成响应,以及评估答案准确性。 设置环境 初始化模型和Key信息 从PDF文件中提取文本
基础RAG实现,最佳入门选择(三)
对提取的块运行查询 运行结果 根据检索到的块生成响应 改进了系统提示词: 使用中文提示词 添加了更详细的回答要求 允许基于部分信息给出回答 优化了搜索参数: 增加搜索的文本块数量(从3个增加到5个)
基础RAG实现,最佳入门选择(二)
初次创建embeddings向量 安装相关依赖 代码 执行效果 基于智谱AI嵌入模型的语义搜索功能 create_embeddings(text) :调用智谱AI的embedding-2模型,将输入文
基础RAG实现,最佳入门选择(一)
基础RAG实现,最佳入门选择(一) 从 PDF 中提取文本 chunk_text 运行得到的结果 智谱AI进行简单的RAG测试 运行结果展示 文本效果展示
RAG入门之数据导入
LangChain 是什么 LangChain 是一个用于构建基于大语言模型(LLM)应用的开源框架。它提供了一套工具和抽象,让开发者能够轻松构建复杂的AI应用。 LangChain 的核心功能 文档