常先森

全栈工程师

获得徽章 13

赞

3

|

搜索文章

RAG 系统评估的工程实践：一些非标准但可长期复用的方法

这篇文章并不是对现有 RAG 评估方法的系统性综述，而是基于多个真实项目中逐步形成的一套工程化经验总结。它不追求形式上的完整，而更强调：在实际工程环境中，这些评估方法是否真的能指导决策。

1月前
61
点赞
评论

【解密源码】WeKnora RAG 检索与重排解析：生产级系统如何筛选可用 Chunk

面对海量“相关”结果，生产级RAG如何精准筛选可用Chunk？本文解密WeKnora源码，揭示其统一多路召回、智能重排与降级策略，直击检索效能核心。

1月前
127
1
评论

【解密源码】WeKnora 文档切分与 Chunk 构建解析：腾讯生产级 RAG 的底层设计

WeKnora 是腾讯开源的一套生产级 RAG 框架，解决真实业务场景下“文档复杂、类型多样、规模可控但质量要求极高”的知识增强问题。本文将聚焦 WeKnora 的文档接入与解析体系。

1月前
142
1
评论

你的RAG需要知识图谱吗？——一套务实的技术选型心法

RAG在复杂关系推理中失效。本文提供四步决策框架，对比LLM自动抽取与人工预定义，提出混合方案三阶段实践路线，帮助工程师判断是否引入知识图谱，核心理念是以业务问题而非技术驱动决策。

2月前
61
点赞
评论

当检索结果“语义正确却答案错误”：一次 RAG 系统的工程化诊断

在 RAG 系统的实际落地过程中，一个最容易被忽视、却最具破坏力的问题是：检索结果在语义上“看起来很合理”，但却完全无法回答用户的问题。本文将拆解这一现象，如何通过工程化手段，来解决这类问题。

2月前
90
点赞
评论

【解密源码】轻量 GrapghRAG - LightRAG 检索工程实践

LightRAG 是一个轻量级 RAG 框架，其核心创新在于融合了知识图谱与向量数据库进行混合检索，提供六种查询模式、智能关键词提取及精细的 Token 管理，旨在提升检索精度和生成效果。

3月前
180
点赞
评论

RAG 表格解析最佳实践：标题识别、表头推断与语义重建全指南

本指南系统梳理了 RAG 场景下表格解析的完整最佳实践，重点解决 OCR 导致的表格结构丢失、标题误识、表头缺失及语义难以还原等核心问题。

3月前
183
点赞
评论

【解密源码】轻量 GrapghRAG - LightRAG 文档解析工程实践

LightRAG 已成为当前最具工程可行性的 GraphRAG 方案之一，让“图谱增强检索”能够以真正务实、低依赖的方式应用于实际业务场景中。

3月前
152
点赞
评论

Agent 上下文管理系列 - mem0 设计全解

mem0 是一个围绕「记忆系统」构建的开源框架，它让大模型具备“长期记忆”的能力。本文将通过源码拆解，带你深入理解 mem0 的核心设计与工作原理，尤其是最关键的记忆创建（add）机制。

3月前
777
点赞
评论

【解密源码】 RAGFlow 召回策略全解

RAGFlow 的召回模块并非简单的向量检索，而是集成了 **参数解析 → 模型一致性校验 → 查询增强 → 混合召回 → 动态重排序 → 阈值过滤与分页** 的完整闭环。

3月前
107
点赞
评论

个人成就

文章被点赞 47

文章被阅读 40,397

掘力值 1,142

加入于

2017-11-23