用 md2mp3 秒级生成带字幕的语音稿:我把 Markdown 变成播客了

42 阅读2分钟

“技术人写文档写到手软,不如顺手生成语音稿?”这是我最近做 md2mp3 项目的初衷。下面分享它的价值、玩法和实战经验


01. 为什么需要 md2mp3?

  • 写作平台、会议纪要越来越依赖语音版本,手动录制耗时、容易出错。
  • 在线 TTS 较多限制,无法批量处理、难以插入双语字幕。
  • md2mp3 用 Python 直接把 Markdown 导出成带 LRC 字幕的 MP3,还能在本地离线运行,兼顾隐私与效率。

image.png


02. 核心卖点一览

  • Markdown 即录音脚本:标题映射章节,列表映射重点,一次写作多处复用。
  • 字幕级别可控:项目内置 example.lrc/ACCUTATE_SUBTITLE_GUIDE.md,能精确控制每句台词的时间轴,配合播放器即可展示卡拉 OK 式字幕。
  • 多平台播放体验player.html 提供原生 H5 播放器,加载 MP3+LRC 即可在浏览器预览。
  • 跨平台脚本:同时提供 test_speed.battest_speed.sh,Windows / Linux / macOS 都能一键跑通。
  • 可扩展:你可以在 md2mp3.py 中更换 TTS 引擎或语言包,实现多语种播报。

03. 快速跑通教程

  1. clone 或下载仓库,确保安装 requirements.txt 中的依赖(主要是 TTS + 音频处理库)。
  2. 准备一个 Markdown 文稿(可参考 example.md)。
  3. 运行 python md2mp3.py example.md,脚本会生成 example.mp3 以及对应的 example.lrc
  4. 打开 player.html,在浏览器选择音频与字幕文件即可预览效果。

image.png


04. 进阶玩法

  • 精准字幕:按照 ACCURATE_SUBTITLE_GUIDE.md 的规范设置时间戳,可实现“单词级”精细同步。
  • 批量生成:将多个 Markdown 放入目录,简单写个循环即可批量生成音频;适合课程或播客系列。
  • 外挂播放器:生成的 MP3/LRC 可直接导入现有音乐播放器,实现“听书”体验;也能在 B 站上传成为配字幕的音频视频。

05. 实战案例分享

我把个人知识星球的周报改写成 Markdown,再用 md2mp3 批量导出音频。发布后,订阅者在通勤中就能听完整份内容,阅读率提升明显。更棒的是,字幕让听众可以跟随关键词快速定位重点。

image.png


06. 未来计划

  • 接入更多 TTS 引擎(如 Azure、阿里云),提供多语种、多音色选择。
  • 增加 CLI 参数模板,让不同项目可以保存独立配置。
  • 打通 Github Actions,实现“提交 Markdown 自动生成音频”的工作流。

07. 开源共创

项目仓库:https://github.com/browniu/md2mp3
欢迎 Star / Issue / PR,期待一起把 Markdown 与音频内容的工作流打磨得更顺滑。若你也在做知识输出、播客、在线课程,md2mp3 或许能让你多出一双“声音的手”。

image.png