首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
AGI技巧
冬奇Lab
创建于2025-12-08
订阅专栏
Prompt 工程、代码审查、AI 辅助重构等
等 23 人订阅
共57篇文章
创建于2025-12-08
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
RAG 系列(十五):CRAG——检索结果不好时自动纠偏
传统 RAG 盲目信任检索结果,知识库覆盖不到时照样生成。CRAG 的思路:先给检索结果打分,不合格就触发网络搜索兜底。用 LangGraph 实现完整流程,附可执行源码
RAG 系列(十四):Self-RAG——让模型决定要不要检索
传统 RAG 每次都检索,即使问题根本不需要外部知识。Self-RAG 用四个反思 token 让模型自主决策。用 LangGraph 实现完整流程:附源码
RAG 系列(十三):查询优化——让问题问得更好
为什么向量检索会因为问法不同而大幅波动?Multi-Query 如何用多角度问法扩大召回面?HyDE 为什么用"假答案"检索比用问题检索更准?
RAG 系列(十二):高级分块策略——Parent-Child 与 Contextual Retrieval
Naive 分块有什么根本缺陷?Parent-Child 如何用小块检索、大块返回?Contextual Retrieval策略是什么,本篇带你用实际代码学会高级分块策略
RAG 系列(十一):Rerank——让检索结果按重要性排队
RAG 系列第十一篇。向量检索召回的文档,排序质量到底有多差?Cross-Encoder 和 Bi-Encoder 的本质区别是什么?
RAG 系列(十):混合检索——让召回更全面
RAG 系列第十篇。纯向量检索遇到精确关键词时为什么会失效?BM25 和向量检索各自擅长什么?RRF 融合算法怎么工作?用代码实测 6 组查询,用 MRR 指标量化三种检索策略的差异
RAG 系列(九):效果不好怎么定位——用 RAGAS 做根因诊断
RAG 系列第九篇。RAG 回答质量差,是检索问题还是生成问题?本文构建一套诊断决策树,通过制造 3 种典型问题(检索召回不足、生成幻觉、答案偏题),用 RAGAS 指标精准定位根因,附完整可运行代码
RAG 系列(八):RAG 评估体系——用数据说话
RAG 系统怎么知道好不好?"用 RAGAS 四个核心指标(Faithfulness、Answer Relevancy、Context Precision、Context Recall)量化评估
RAG 系列(七):检索策略——如何找到最相关的内容
RAG 系列第七篇。相似度检索、MMR、阈值过滤、Self-Query 四种检索策略有什么区别?MMR 如何解决结果重复?Self-Query 怎么让 LLM 自动生成过滤条件?用代码实测对比四种策略
RAG 系列(六):向量数据库——存储与检索的基础设施
RAG 系列第六篇。向量数据库的核心能力是什么?Chroma、Qdrant、Weaviate、pgvector、Pinecone 怎么选?元数据过滤和相似度算法怎么用?本篇带你一一了解
RAG 系列(五):Embedding 模型——语义理解的核心
RAG 系列第五篇。Embedding 是什么?为什么它能表示语义?OpenAI、BGE、Cohere 等主流模型怎么选?用 MTEB 榜单看懂模型排名,用同一批中文文档实测 OpenAI和BGE
RAG 系列(四):文档处理——从原始文件到高质量 Chunk
RAG 系列第四篇。4 种分块策略深度对比:固定大小、递归字符、语义分块、文档结构分块。用同一份 Markdown 文档实测每种策略的效果差异,附可视化对比和选型决策表。
RAG 系列(三):调对这 4 个参数,让你的 RAG 从「能用」变「好用」
RAG 系列第三篇。Chunk Size、Chunk Overlap、Top-K、Embedding Model 这四个参数怎么选?用控制变量实验对比不同参数组合的效果,附5 个最常踩的坑
一天一个开源项目(第88篇):pi-mono - 极简主义的高性能 AI 编程助手
一个由 libGDX 作者 Mario Zechner 开发的极简 AI 编程 Agent,主打极速响应、极简内核与极致控制力。
RAG 系列(二):用 LangChain 搭建你的第一个 RAG Pipeline
RAG 系列第二篇。用 LangChain 1.x + ChromaDB + SiliconFlow 拆解 RAG 六大组件,附完整可运行的 PDF 问答代码。所有源码可在 GitHub 获取。
RAG 系列(一):大模型为什么需要「外挂记忆」
RAG 系列第一篇。从 LLM 的两个根本局限出发,搞清楚 RAG 是什么、为什么需要它,以及它和微调、长上下文的本质区别。附 100 行手写最小 RAG 实现。
SubAgent 原理深度解析:AI 系统如何通过委托实现专业化分工
从上下文爆炸的工程痛点出发,深入解析 SubAgent 的核心模型、委托机制、三种执行模式与两种通信范式,结合 Claude Code 的完整实现,帮你真正搞懂 AI 系统的专业化分工原理。
大模型就是你雇的员工:从职场管理学看 AI 协作范式的三次进化
用企业从创业团队到成熟组织的进化过程,类比 Prompt Engineering、Context Engineering、Harness Engineering 的演进脉络,并预测下一步的两个发展方向
5种来自谷歌的Agent Skill设计模式:减少Token浪费,精准触发正确行为
整理自Google ADK智能体工程专家Lavi Nigam的核心内容,总结5种可落地的SKILL.md设计模式,帮助开发者减少Token浪费、提升Skill编写质量
从 Prompt 工程师到 Harness 工程师:AI 协作范式的三次进化
深入解析 Prompt Engineer、Context Engineer、Harness Engineer 三个概念的演变脉络,用人类世界的经典类比让你彻底搞懂什么是"驾驭 AI"的正确姿势
下一页