用 md2mp3 秒级生成带字幕的语音稿：我把 Markdown 变成播客了

2025-11-29 42 阅读2分钟

“技术人写文档写到手软，不如顺手生成语音稿？”这是我最近做 md2mp3 项目的初衷。下面分享它的价值、玩法和实战经验

01. 为什么需要 md2mp3？

写作平台、会议纪要越来越依赖语音版本，手动录制耗时、容易出错。
在线 TTS 较多限制，无法批量处理、难以插入双语字幕。
md2mp3 用 Python 直接把 Markdown 导出成带 LRC 字幕的 MP3，还能在本地离线运行，兼顾隐私与效率。

02. 核心卖点一览

Markdown 即录音脚本：标题映射章节，列表映射重点，一次写作多处复用。
字幕级别可控：项目内置 example.lrc/ACCUTATE_SUBTITLE_GUIDE.md，能精确控制每句台词的时间轴，配合播放器即可展示卡拉 OK 式字幕。
多平台播放体验：player.html 提供原生 H5 播放器，加载 MP3+LRC 即可在浏览器预览。
跨平台脚本：同时提供 test_speed.bat、test_speed.sh，Windows / Linux / macOS 都能一键跑通。
可扩展：你可以在 md2mp3.py 中更换 TTS 引擎或语言包，实现多语种播报。

03. 快速跑通教程

clone 或下载仓库，确保安装 requirements.txt 中的依赖（主要是 TTS + 音频处理库）。
准备一个 Markdown 文稿（可参考 example.md）。
运行 python md2mp3.py example.md，脚本会生成 example.mp3 以及对应的 example.lrc。
打开 player.html，在浏览器选择音频与字幕文件即可预览效果。

04. 进阶玩法

精准字幕：按照 ACCURATE_SUBTITLE_GUIDE.md 的规范设置时间戳，可实现“单词级”精细同步。
批量生成：将多个 Markdown 放入目录，简单写个循环即可批量生成音频；适合课程或播客系列。
外挂播放器：生成的 MP3/LRC 可直接导入现有音乐播放器，实现“听书”体验；也能在 B 站上传成为配字幕的音频视频。

05. 实战案例分享

我把个人知识星球的周报改写成 Markdown，再用 md2mp3 批量导出音频。发布后，订阅者在通勤中就能听完整份内容，阅读率提升明显。更棒的是，字幕让听众可以跟随关键词快速定位重点。

06. 未来计划

接入更多 TTS 引擎（如 Azure、阿里云），提供多语种、多音色选择。
增加 CLI 参数模板，让不同项目可以保存独立配置。
打通 Github Actions，实现“提交 Markdown 自动生成音频”的工作流。

07. 开源共创

项目仓库：https://github.com/browniu/md2mp3
欢迎 Star / Issue / PR，期待一起把 Markdown 与音频内容的工作流打磨得更顺滑。若你也在做知识输出、播客、在线课程，md2mp3 或许能让你多出一双“声音的手”。