whisper - 用户34352393554的收藏集 - 掘金

whisper

用户34352393554

更多收藏集

14篇文章 · 0订阅

音频可视化-简单实现

音频可视化是不是很难，如何将音频数据转换成可视化的图表，本文带你一起走进浏览器的音频世界，第一次写帖子，希望大佬们多多来看看指点一下

肥胖请远离我
2年前
5.7k
79
33

基于wavesurfer.js实现音频可视化案例（有源码链接）

wavesurfer.js是什么？ Wavesurfer.js是一款用于在Web浏览器中实时可视化音频波形的JavaScript库。

世上只有一个唐广君
2年前
6.0k
28
2

基于wavesurfer.js实现音频可视化案例（有源码链接）

wavesurfer.js-声纹可视化

一、效果将一段声频以波形展示在页面上，支持播放/暂停、重放、停止、点击跳转播放 2. 支持渲染区域，支持用户手动选择区域和删除区域，支持拖动区域和调整区域大小；当操作区域时，最好能实时循环播放区域

蓝色海岛
3年前
9.1k
163
9

七个很实用的开源项目「GitHub 热点速览」

本周特推的两个项目都是异常实用的项目，一个接棒上周的视频重制项目 video-retalking 这次则是直接将视频替换成另外一个语种；另外一个则是解决日志阅读问题的 tailspin，让你在成千上万

HelloGitHub
2年前
18k
27
2

七个很实用的开源项目「GitHub 热点速览」

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型该模型是由Hugging Face团队开发，它在Whisper核心功能的基础上进行了优化和简化，体积缩小了50%。

大鹏学开发
2年前
929
1
评论

Distil-Whisper：比Whisper快6倍，体积小50%的语音识别模型

民谣女神唱流行，基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

流行天后孙燕姿的音色固然是极好的，但是目前全网都是她的声音复刻，听多了难免会有些审美疲劳，在网络上检索了一圈，还没有发现民谣歌手的音色模型，人就是这样，得不到的永远在骚动，本次我们自己构建训练集

刘悦的技术博客
3年前
2.0k
17
4

民谣女神唱流行，基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

Faster-Whisper是Whisper开源后的第三方进化版本，它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，

刘悦的技术博客
2年前
4.8k
18
1

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

几行代码把Chrome搞崩溃之：HTML5 MP3录音由ScriptProcessorNode升级成AudioWorkletNode采坑记

在刚开始编写好测试的过程中，发现只要交互操作足够快，Chrome (版本:97)浏览器经常莫名其妙的崩溃（从来没有见过的现象），老版本Chrome80也会崩溃

xiangyuecn
4年前
2.1k
11
评论

网页js版音频数字信号处理：H5录音+特定频率信号的特征分析和识别提取

音频数字信号处理 Audio DSP (Digital Signal Processing) 是一个复杂又专业的话题，本文介绍的是如何从音频中实时分析和识别出特定频率信号的一种方法，对应的代码为可运行

xiangyuecn
3年前
2.6k
11
5

OpenAI-API 接口文档(中文版)

OpenAI的接口文档中文版，基于OpenAI官网的API作的一个翻译，编译参考辅助。想要全面的学习还得去看英文文档，毕竟出处在那！

天怎么不会塌
3年前
73k
119
17

OpenAI-API 接口文档(中文版)