“技术人写文档写到手软,不如顺手生成语音稿?”这是我最近做 md2mp3 项目的初衷。下面分享它的价值、玩法和实战经验
01. 为什么需要 md2mp3?
- 写作平台、会议纪要越来越依赖语音版本,手动录制耗时、容易出错。
- 在线 TTS 较多限制,无法批量处理、难以插入双语字幕。
- md2mp3 用 Python 直接把 Markdown 导出成带 LRC 字幕的 MP3,还能在本地离线运行,兼顾隐私与效率。
02. 核心卖点一览
- Markdown 即录音脚本:标题映射章节,列表映射重点,一次写作多处复用。
- 字幕级别可控:项目内置
example.lrc/ACCUTATE_SUBTITLE_GUIDE.md,能精确控制每句台词的时间轴,配合播放器即可展示卡拉 OK 式字幕。 - 多平台播放体验:
player.html提供原生 H5 播放器,加载 MP3+LRC 即可在浏览器预览。 - 跨平台脚本:同时提供
test_speed.bat、test_speed.sh,Windows / Linux / macOS 都能一键跑通。 - 可扩展:你可以在
md2mp3.py中更换 TTS 引擎或语言包,实现多语种播报。
03. 快速跑通教程
- clone 或下载仓库,确保安装
requirements.txt中的依赖(主要是 TTS + 音频处理库)。 - 准备一个 Markdown 文稿(可参考
example.md)。 - 运行
python md2mp3.py example.md,脚本会生成example.mp3以及对应的example.lrc。 - 打开
player.html,在浏览器选择音频与字幕文件即可预览效果。
04. 进阶玩法
- 精准字幕:按照
ACCURATE_SUBTITLE_GUIDE.md的规范设置时间戳,可实现“单词级”精细同步。 - 批量生成:将多个 Markdown 放入目录,简单写个循环即可批量生成音频;适合课程或播客系列。
- 外挂播放器:生成的 MP3/LRC 可直接导入现有音乐播放器,实现“听书”体验;也能在 B 站上传成为配字幕的音频视频。
05. 实战案例分享
我把个人知识星球的周报改写成 Markdown,再用 md2mp3 批量导出音频。发布后,订阅者在通勤中就能听完整份内容,阅读率提升明显。更棒的是,字幕让听众可以跟随关键词快速定位重点。
06. 未来计划
- 接入更多 TTS 引擎(如 Azure、阿里云),提供多语种、多音色选择。
- 增加 CLI 参数模板,让不同项目可以保存独立配置。
- 打通 Github Actions,实现“提交 Markdown 自动生成音频”的工作流。
07. 开源共创
项目仓库:https://github.com/browniu/md2mp3
欢迎 Star / Issue / PR,期待一起把 Markdown 与音频内容的工作流打磨得更顺滑。若你也在做知识输出、播客、在线课程,md2mp3 或许能让你多出一双“声音的手”。