whisper - hunter的收藏集 - 掘金

whisper

更多收藏集

17篇文章 · 0订阅

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

Faster-Whisper是Whisper开源后的第三方进化版本，它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，

刘悦的技术博客
2年前
4.8k
18
1

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

Bert-vits2-2.3-Final，Bert-vits2最终版一键整合包(复刻生化危机艾达王)

近日，Bert-vits2发布了最新的版本2.3-final，意为最终版，修复了一些已知的bug，添加基于 WavLM 的 Discriminator（来源于 StyleTTS2），令人意外的是，因

刘悦的技术博客
2年前
2.1k
5
评论

Bert-vits2-2.3-Final，Bert-vits2最终版一键整合包(复刻生化危机艾达王)

音视频转文字不求人，OpenAI Whisper来帮您

😀 一直有音视频转文字，然后做笔记或总结的习惯，两年前写了一个字幕提取工具，破解了第三方语音转文字APP的API，用脚本批量调接口来提取。当时掏了98买了两年服务，前阵子过期了，按照我的使用频次

coder_pig
2年前
6.5k
49
13

音视频转文字不求人，OpenAI Whisper来帮您

推荐5款本周超火的开源AI项目

1、AnimateAnyone AnimateAnyone 项目是由阿里巴巴智能计算研究院开发，你只需提供一个静态的角色图像（包括真人、动漫/卡通角色等）和一些动作、姿势（比如跳舞、走路），便可将其动

开源星探
2年前
3.2k
29
7

Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)

中英文混合输出是文本转语音(TTS)项目中很常见的需求场景，尤其在技术文章或者技术视频领域里，其中文文本中一定会夹杂着海量的英文单词，我们当然不希望AI口播只会念中文，Bert-vits2老版本

刘悦的技术博客
2年前
2.8k
5
评论

Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)

离线生成双语字幕,一键生成中英双语字幕,基于AI大模型,ModelScope

制作双语字幕的方案网上有很多，林林总总，不一而足。制作双语字幕的原理也极其简单，无非就是人声背景音分离、语音转文字、文字翻译，最后就是字幕文件的合并，但美中不足之处这些环节中需要接口api的参与，比

刘悦的技术博客
2年前
2.3k
8
评论

离线生成双语字幕,一键生成中英双语字幕,基于AI大模型,ModelScope

一文搞懂“视频翻译与配音工具”

一个开源的视频翻译和配音工具，可将一种语言和发音的视频，处理后变为另一种语言发音的视频，并嵌入该语言字幕。比如有一个英文电影，发音是英文，使用这个工具处理后，可以转成带中文字幕和配音的视频

mortimer
2年前
7.6k
5
7

一文搞懂“视频翻译与配音工具”

只要三分钟！使用OpenAI API构建语音对话聊天机器人

在这篇文章中，我们将深入探讨如何结合Gradio库和OpenAI API，创建一个功能丰富的音频处理应用。通过本指南，你将学会如何利用这些强大的工具，实现音频转文本、文本处理以及文字转语音的完整流程。

程序的搬运工
2年前
6.2k
5
评论

只要三分钟！使用OpenAI API构建语音对话聊天机器人

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的

刘悦的技术博客
2年前
6.2k
20
10

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型该模型是由Hugging Face团队开发，它在Whisper核心功能的基础上进行了优化和简化，体积缩小了50%。

大鹏学开发
2年前
932
1
评论

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型