首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
常先森
掘友等级
全栈工程师
获得徽章 13
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 2
沸点 1
赞
3
返回
|
搜索文章
最新
热门
上下文工程2.0:从设计到实践的全景方法论
未来的上下文工程将不再是“让 AI 记住上下文”,而是让 AI 理解并共创上下文。 而真正的智能,不是拥有记忆,而是知道——什么值得被记住。
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(html & json & doc 篇)
在 RAGFlow 的多文档解析体系中,HTML、JSON 与 DOC 三类文档具有天然的结构化特性。 相较于 PDF、Markdown 等复杂输入,它们的语义边界更清晰、噪声更少、解析路径更短。
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(markdown 篇)
在 RAGFlow 中,Markdown 以其自带的语义结构,使解析器无需 OCR 或排版分析即可精准还原内容层次,是一种独特且高效的输入类型。
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(excel & csv & txt 篇)
本期我们将聚焦这些结构化与半结构化数据的处理方案。Excel/CSV/TXT 文档的处理更注重数据完整性、格式保真和高效提取。RAGFlow 通过精巧的设计,为每种格式提供了最优的语义切块策略。
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(pdf 篇)
本期我们将挑战文档处理领域的"终极 BOSS"—— pdf 格式。作为最复杂、最通用的文档格式,版面布局千变万化,文字提取难度极高。RAGFlow 为不同特性的 pdf 文档提供了针对性的解决方案。
【解密源码】 RAGFlow 切分最佳实践- naive parser 语义切块(docx 篇)
本期我们将从通用机制深入到具体文件类型的实现逻辑,聚焦 word 文档在 navie parser 下的语义切块原理。
【解密源码】 RAGFlow 切分最佳实践-navie 分词器原理
本期对 ragflow 分词器的原理进行详细拆解。这一模块作为所有文档类型解析流程的公共组件,承担了语义分段、文本归一化、chunk 边界控制等底层职责。
【解密源码】 RAGFlow 切分最佳实践-上传与解析全流程
本系列文章带你从源码角度深度剖析 RAGFlow,从文件上传、解析、切分、向量化到最终入库。本文聚焦于文档解析与切分的全流程概述,为理解整个 RAGFlow 流程打下基础。
为什么你的 DeepSeek-OCR 不好用?DeepSeek 与 PaddleOCR-VL 全面测评
对比 DeepSeek-OCR 与 PaddleOCR-VL,揭示前者识别弱但理解强的本质,解释你觉得它“不好用”的真正原因。
一图胜千言:DeepSeek、Glyph 与 PaddleOCR-VL 的不同答案
当 AI 能“看懂”图片,它是否比人更懂文字?本文拆解三种最新视觉方案——DeepSeek-OCR、PaddleOCR-VL、Glyph,讨论背后隐藏问题:AI 的阅读力,究竟比我们更聪明,还是更模糊
下一页
个人成就
文章被点赞
44
文章被阅读
34,576
掘力值
869
关注了
23
关注者
12
收藏集
1
关注标签
24
加入于
2017-11-23