首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
常先森
掘友等级
全栈工程师
获得徽章 13
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 2
沸点 1
赞
3
返回
|
搜索文章
最新
热门
RAG 表格解析最佳实践:标题识别、表头推断与语义重建全指南
本指南系统梳理了 RAG 场景下表格解析的完整最佳实践,重点解决 OCR 导致的表格结构丢失、标题误识、表头缺失及语义难以还原等核心问题。
【解密源码】 轻量 GrapghRAG - LightRAG 文档解析工程实践
LightRAG 已成为当前最具工程可行性的 GraphRAG 方案之一,让“图谱增强检索”能够以真正务实、低依赖的方式应用于实际业务场景中。
Agent 上下文管理系列 - mem0 设计全解
mem0 是一个围绕「记忆系统」构建的开源框架,它让大模型具备“长期记忆”的能力。本文将通过源码拆解,带你深入理解 mem0 的核心设计与工作原理,尤其是最关键的记忆创建(add)机制。
【解密源码】 RAGFlow 召回策略全解
RAGFlow 的召回模块并非简单的向量检索,而是集成了 **参数解析 → 模型一致性校验 → 查询增强 → 混合召回 → 动态重排序 → 阈值过滤与分页** 的完整闭环。
【解密源码】 RAGFlow 切分最佳实践- ppt 篇
在 RAGFlow 的文档解析体系中,PPT 文件的解析流程相对独特。它不仅要提取页面中的文字、表格内容,还需要生成每一页的缩略图,保证多模态检索场景下的语义对齐。
【解密源码】 RAGFlow 切分最佳实践- book 篇
书籍文件往往篇幅巨大、结构复杂,不同章节、目录、致谢等混杂在同一文档中。RAGFlow 通过自动识别版面结构、过滤非正文、并结合视觉模型生成图片摘要,实现对长文档的精准切分与高质量抽取。
从“史上最蠢想法”到百亿估值:Gamma 创始人 Grant Lee 揭秘 AI 时代的反常识增长法则
Gamma 从被质疑到年收入超1亿美元,创始人Grant Lee分享反常识增长法则:聚焦前30秒体验和真实口碑传播。
【解密源码】 RAGFlow 切分最佳实践- paper 篇
论文类文档是 RAG 应用中最具挑战性的解析类型之一。 与普通 pdf 或 ppt 不同的是,paper 通常包含复杂的版面结构:摘要、公式、表格、参考文献等,且跨且跨页、双栏、脚注等情况极为常见。
上下文工程2.0:从设计到实践的全景方法论
未来的上下文工程将不再是“让 AI 记住上下文”,而是让 AI 理解并共创上下文。 而真正的智能,不是拥有记忆,而是知道——什么值得被记住。
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(html & json & doc 篇)
在 RAGFlow 的多文档解析体系中,HTML、JSON 与 DOC 三类文档具有天然的结构化特性。 相较于 PDF、Markdown 等复杂输入,它们的语义边界更清晰、噪声更少、解析路径更短。
下一页
个人成就
文章被点赞
45
文章被阅读
36,010
掘力值
1,029
关注了
23
关注者
13
收藏集
1
关注标签
24
加入于
2017-11-23