首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
常先森
掘友等级
全栈工程师
获得徽章 13
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 2
沸点 1
赞
3
返回
|
搜索文章
常先森
全栈工程师
·
2天前
关注
【解密源码】 RAGFlow 召回策略全解
RAGFlow 的召回模块并非简单的向量检索,而是集成了 **参数解析 → 模型一致性校验 → 查询增强 → 混合召回 → 动态重排序 → 阈值过滤与分页** 的完整闭环。...
0
评论
分享
常先森
全栈工程师
·
3天前
关注
【解密源码】 RAGFlow 切分最佳实践- ppt 篇
在 RAGFlow 的文档解析体系中,PPT 文件的解析流程相对独特。它不仅要提取页面中的文字、表格内容,还需要生成每一页的缩略图,保证多模态检索场景下的语义对齐。...
0
评论
分享
常先森
全栈工程师
·
7天前
关注
【解密源码】 RAGFlow 切分最佳实践- book 篇
书籍文件往往篇幅巨大、结构复杂,不同章节、目录、致谢等混杂在同一文档中。RAGFlow 通过自动识别版面结构、过滤非正文、并结合视觉模型生成图片摘要,实现对长文档的精准切分...
0
评论
分享
常先森
全栈工程师
·
8天前
关注
从“史上最蠢想法”到百亿估值:Gamma 创始人 Grant Lee 揭秘 AI 时代的反常识增长法则
Gamma 从被质疑到年收入超1亿美元,创始人Grant Lee分享反常识增长法则:聚焦前30秒体验和真实口碑传播。...
0
评论
分享
常先森
全栈工程师
·
13天前
关注
【解密源码】 RAGFlow 切分最佳实践- paper 篇
论文类文档是 RAG 应用中最具挑战性的解析类型之一。 与普通 pdf 或 ppt 不同的是,paper 通常包含复杂的版面结构:摘要、公式、表格、参考文献等,且跨且跨页、...
0
评论
分享
常先森
全栈工程师
·
15天前
关注
上下文工程2.0:从设计到实践的全景方法论
未来的上下文工程将不再是“让 AI 记住上下文”,而是让 AI 理解并共创上下文。 而真正的智能,不是拥有记忆,而是知道——什么值得被记住。...
0
评论
分享
常先森
全栈工程师
·
16天前
关注
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(html & json & doc 篇)
在 RAGFlow 的多文档解析体系中,HTML、JSON 与 DOC 三类文档具有天然的结构化特性。 相较于 PDF、Markdown 等复杂输入,它们的语义边界更清晰、...
0
评论
分享
常先森
全栈工程师
·
18天前
关注
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(markdown 篇)
在 RAGFlow 中,Markdown 以其自带的语义结构,使解析器无需 OCR 或排版分析即可精准还原内容层次,是一种独特且高效的输入类型。...
0
评论
分享
常先森
全栈工程师
·
20天前
关注
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(excel & csv & txt 篇)
本期我们将聚焦这些结构化与半结构化数据的处理方案。Excel/CSV/TXT 文档的处理更注重数据完整性、格式保真和高效提取。RAGFlow 通过精巧的设计,为每种格式提供...
0
评论
分享
常先森
全栈工程师
·
23天前
关注
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(pdf 篇)
本期我们将挑战文档处理领域的"终极 BOSS"—— pdf 格式。作为最复杂、最通用的文档格式,版面布局千变万化,文字提取难度极高。RAGFlow 为不同特性的 pdf 文...
2
评论
分享
常先森
全栈工程师
·
25天前
关注
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(docx 篇)
本期我们将从通用机制深入到具体文件类型的实现逻辑,聚焦 word 文档在 navie parser 下的语义切块原理。...
1
评论
分享
常先森
全栈工程师
·
27天前
关注
【解密源码】 RAGFlow 切分最佳实践-navie 分词器原理
本期对 ragflow 分词器的原理进行详细拆解。这一模块作为所有文档类型解析流程的公共组件,承担了语义分段、文本归一化、chunk 边界控制等底层职责。...
0
评论
分享
常先森
全栈工程师
·
28天前
关注
【解密源码】 RAGFlow 切分最佳实践-上传与解析全流程
本系列文章带你从源码角度深度剖析 RAGFlow,从文件上传、解析、切分、向量化到最终入库。本文聚焦于文档解析与切分的全流程概述,为理解整个 RAGFlow 流程打下基础。...
0
评论
分享
常先森
全栈工程师
·
1月前
关注
为什么你的 DeepSeek-OCR 不好用?DeepSeek 与 PaddleOCR-VL 全面测评
对比 DeepSeek-OCR 与 PaddleOCR-VL,揭示前者识别弱但理解强的本质,解释你觉得它“不好用”的真正原因。...
0
评论
分享
常先森
全栈工程师
·
1月前
关注
一图胜千言:DeepSeek、Glyph 与 PaddleOCR-VL 的不同答案
当 AI 能“看懂”图片,它是否比人更懂文字?本文拆解三种最新视觉方案——DeepSeek-OCR、PaddleOCR-VL、Glyph,讨论背后隐藏问题:AI 的阅读力,...
0
评论
分享
常先森
赞了这篇文章
华洛
十年程序员,现AI产品负责人,AI产品升级专家。
·
2月前
关注
SEO还没死,GEO之战已经开始
“传统搜索引擎优化(seo)尚未退出历史舞台,但生成式引擎优化(geo)已经成为新的战场。” 当未来互联网上AI比人多的时候,网站应该怎么办?...
65
20
分享
常先森
全栈工程师
·
1年前
关注
Graph RAG 真的适合我吗?
近期,微软开源的下一代 RAG 技术—— Graph RAG 被开发者们津津乐道,相比较传统的 RAG,它更高效,更全面,更准确,然而代价是什么,Graph RAG 真的适...
0
评论
分享
常先森
全栈工程师
·
2年前
关注
大模型实用指南,如何为自己的业务选择最佳大模型?
在人工智能领域,如何选择适合的大模型可能令人困惑。本文将深入探讨三种基础架构及其代表模型,并通过介绍三种基准测试,帮助你理解如何评价和选择模型。让我们一起找到最适合你的大模...
1
评论
分享
常先森
全栈工程师
·
2年前
关注
信我!这里有普通人也能理解的 Transformer
你一定听说过当下风靡全球的 ChatGPT,但你知道它是如何利用 Transformer 模型的神奇力量吗?这里将用最通俗易懂的方式,揭秘 Transformer 的来龙去...
8
评论
分享
常先森
关注了
ShowMeAI
全栈工程师
下一页
个人成就
文章被点赞
45
文章被阅读
35,184
掘力值
948
关注了
23
关注者
13
收藏集
1
关注标签
24
加入于
2017-11-23