首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
RAG
YaeZed
创建于2026-01-13
订阅专栏
DataWhale all-in-rag开源项目学习记录
暂无订阅
共6篇文章
创建于2026-01-13
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
RAG-项目实战一(GraphRAG优化)
一.GraphRAG与传统RAG的区别 特性 传统 RAG GraphRAG 检索核心 语义相似度(向量距离) 语义 + 拓扑关系(点线网) 理解深度 只能找到“长得像”的片段 能通过“多跳”发现隐含
RAG-项目实战一(基础篇)
基于HowToCook项目的菜谱数据,构建一个智能的食谱问答系统。用户可以: 询问具体菜品的制作方法:"宫保鸡丁怎么做?" 寻求菜品推荐:"推荐几个简单的素菜" 获取食材信息:"红烧肉需要什么食材?"
RAG-检索优化
一.混合检索 1.稀疏向量和稠密向量 稀疏向量:也被称为“词法向量”,维度高,但多为0,通常用于关键词的精确匹配,将文档视为一堆词的集合,不考虑其语法和顺序,每一维向量都代表一个词,向量中的非零值代表
RAG-索引构建
一.向量嵌入Embedding 1.什么是Embedding 核心定义:将非结构化的数据(如文本,音频,图片等)映射为低维,稠密,连续的实数向量的过程。 三要素: 数据:原始的数据内容 嵌入模型:深度
数据准备
1.数据加载 (1)在 RAG 系统中,数据加载器(Data Loader)处于最前端,主要完成以下三个核心任务: 内容提取:将 PDF、Word、Markdown、HTML 等不同格式的原始文档转换
解锁RAG
1.RAG定义 RAG,英文全称Retrieval-Augmented Generation,检索增强生成,它通过从外部知识库中检索相关的实时信息,来增强大语言模型的回答生成能力。 2.为什么需要使用