ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言

534 阅读3分钟

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

功能:将多种电子书格式转换为有声书格式,支持高质量文本到语音转换。
多语言支持:支持 16 种语言,适应不同用户的需要。
易用性:提供命令行、Web 界面和 Docker 容器等多种使用方式。

正文(附运行示例)

ebook2audiobookXTTS 是什么

公众号: 蚝油菜花 - ebook2audiobookXTTS

ebook2audiobookXTTS 是一款开源的 AI 工具,旨在将电子书转换为有声书。该工具支持多种电子书格式,如 EPUB、PDF、MOBI 等,并利用 Coqui XTTS 技术实现高质量的文本到语音转换。

ebook2audiobookXTTS 不仅支持 16 种语言,还提供了命令行、Web 界面和 Docker 容器等多种使用方式,使得用户可以方便地进行操作。转换后的有声书格式为 .m4b,包含章节和元数据,便于在各种设备上收听。

ebook2audiobookXTTS 的主要功能

  • 格式转换:将多种电子书格式(如 EPUB、PDF、MOBI 等)转换为有声书格式(.m4b)。
  • 高质量 TTS:利用 Coqui XTTS 技术,实现接近真人发音的高质量文本到语音转换。
  • 多语言支持:支持包括英语、中文在内的 16 种语言,适应不同用户的需要。
  • 章节识别:自动识别电子书中的章节,并在有声书中创建相应的章节标记。
  • 元数据保留:保留电子书的元数据,如标题、作者、封面等,便于管理和识别。
  • 易用性:提供命令行界面、Web 界面和 Docker 容器等多种使用方式,方便用户操作。

ebook2audiobookXTTS 的技术原理

  • Calibre:Calibre 是一个强大的电子书管理和转换工具,能够处理多种电子书格式,包括 EPUB、MOBI、PDF 等。在 ebook2audiobookXTTS 中,Calibre 将电子书转换为文本格式,这是后续文本到语音(TTS)转换的前提。
  • Coqui XTTS:Coqui XTTS 是 Mozilla 的 Coqui 团队推出的一个文本到语音(TTS)系统。它利用深度学习技术生成自然听起来的语音,特点是能够创建具有特定声音特征的合成语音,在声音克隆和多语言支持方面表现出色。

如何运行 ebook2audiobookXTTS

安装依赖

  1. 安装 Python 3.x:从 Python.org 下载并安装。
  2. 安装 Calibre
  • Ubuntusudo apt-get install -y calibre
  • macOSbrew install calibre
  • Windows:在管理员 PowerShell 中运行 choco install calibre
  1. 安装 FFmpeg
  • Ubuntusudo apt-get install -y ffmpeg
  • macOSbrew install ffmpeg
  • Windows:在管理员 PowerShell 中运行 choco install ffmpeg
  1. 安装 Python 包
pip install coqui-tts==0.24.2 pydub nltk beautifulsoup4 ebooklib tqdm gradio==4.44.0
python -m nltk.downloader punkt
python -m nltk.downloader punkt_tab

运行示例

启动 Gradio Web 界面
  1. 运行脚本
python app.py
  1. 打开 Web 应用:点击终端中提供的 URL 访问 Web 应用并转换电子书。
基本无头模式使用
python app.py --headless True --ebook <path_to_ebook_file> --voice [path_to_voice_file] --language [language_code]

使用 Docker

运行 Docker 容器
  • 仅使用 CPU
docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobookxtts:huggingface python app.py
  • 使用 GPU 加速
docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobookxtts:huggingface python app.py

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦