Word文章发到掘金格式全乱了?我做了一个工具3秒搞定

1 阅读3分钟

写技术文章的习惯用 Word,毕竟 Word 的编辑功能强大,排版也方便。但是每次要把文章发布到掘金、CSDN 或者个人博客时,噩梦就开始了。 复制粘贴过去一看:

  • 表格格式全乱,列对不齐
  • 代码块没有高亮,变成普通文本
  • 标题层级错乱,H1H2混在一起
  • 列表缩进丢失,层级关系看不出来 手动调整半小时,心态直接炸了。 我试过很多在线转换工具,要么收费,要么需要上传文档到他们的服务器(隐私担忧),要么转换出来的 Markdown 格式依然一塌糊涂,该乱还是乱。 于是我就想:能不能做一个本地运行的转换工具,既安全又智能?

介绍一下 DocMD DocMD 是一个本地运行的文档转 Markdown 工具,核心特点:

  1. 支持多种格式 Word、PDF(包括影印件)、Excel、PPT、图片,都可以一键转成 Markdown。对于我们这种经常需要整理各种格式文档的人来说,非常实用。
  2. AI 智能优化格式 这是我最看重的一个功能。转换后的 Markdown 不是简单的文本提取,而是会通过通义千问 AI 进行格式优化:
  • 表格会自动整理成 Markdown 表格格式
  • 代码块会识别语言类型并添加语法高亮
  • 标题层级会智能识别并调整
  • 列表缩进和层级关系会保留
  1. 批量处理 最多支持一次转换10个文件。如果你有一批文档需要整理,这个功能能节省大量时间。
  2. 本地运行,完全免费 所有处理都在本地完成,文档不会上传到云端,隐私安全有保障。而且完全免费,代码开源。

实际使用体验 我最近用它整理了一篇3000字的技术文章,原文是一个包含表格、代码块、多层列表的 Word 文档。 转换过程:

  1. 上传 Word 文件
  2. 点击转换
  3. 等待5秒
  4. 得到格式化完美的 Markdown 转换后的效果:
  • 表格格式完整保留,列对齐完美
  • 代码块自动识别为 JavaScript,语法高亮正常
  • 标题层级正确(H1-H4)
  • 列表缩进和嵌套关系清晰

适用场景

  1. 技术博主 习惯用 Word 写文章,但需要发布到 Markdown 平台(掘金、CSDN、个人博客等)。
  2. 文档整理者 需要整理各种格式的文档,统一转成 Markdown 格式存储。
  3. AI 训练数据准备 如果你在做 AI 微调或者知识库,需要大量 Markdown 格式的训练数据,这个工具可以批量处理。
  4. 多平台内容发布 一个内容要发布到多个平台,格式不兼容,可以用这个工具快速转换。

技术实现(给开发者参考) 如果你对技术实现感兴趣:

  • 后端:Python + FastAPI
  • 文档解析:mammoth(Word)、pdfplumber(PDF)、openpyxl(Excel)
  • AI 优化:通义千问 API
  • 前端:Vue 3 + Element Plus
  • 环境:需安装 Python node 核心逻辑是先用相应的库解析文档结构,然后通过 AI 对格式进行智能优化,最后输出标准 Markdown。

如果你也经常遇到 Word 转 Markdown 格式混乱的问题,不妨试试 DocMD。 核心优势:

  • 本地运行,数据安全
  • AI 优化,格式完美
  • 完全免费,开源
  • 支持批量处理 试用地址:http://115.120.196.63:5174 有任何问题或建议,欢迎在评论区交流~