音视频 - yorickshan的收藏集 - 掘金

音视频

yorickshan 创作等级LV.1

更多收藏集

25篇文章 · 0订阅

【在线聊天室😻】前端进阶全栈开发🔥

私聊、聊天室 Nestjs+TypeOrm(Mysql)+JWT+Socket.IO 🎉 React18/服务端渲染Nextjs+Redux-toolkit+styled-components🎉

麦麦猫
2年前
6.1k
81
14

【在线聊天室😻】前端进阶全栈开发🔥

前端 er 如何玩转音视频流-WebRTC 技术介绍

前端 er 如何玩转音视频流-WebRTC 技术介绍最近做了一个 AI 问答的项目，需要获取用户的摄像头，录像录音，实时语音转文字等等功能，记录一下踩过的坑。以及目前的最佳实现。

既见君子
2年前
8.1k
126
26

前端 er 如何玩转音视频流-WebRTC 技术介绍

使用 Web Audio API 实现实时音频可视化

在音频可视化的旅程中，我深入研究了Web Audio API和傅里叶变换，透过数学镜头，揭示了声音的频域之美，创造出实时频谱图的引人入胜的可视化体验。

zowie
2年前
4.0k
32
4

使用 Web Audio API 实现实时音频可视化

用 Wavesurfer.js 和 React 快速打造你的音频录播功能❤️

本文详细介绍了如何使用 Wavesurfer.js 和 React 创建一个基本的音频录音与播放器。本教程简明易懂，有助于读者快速掌握如何利用 Wavesurfer.js 和 React 搭建音频播放

027西瓜皮
2年前
4.9k
28
3

用 Wavesurfer.js 和 React 快速打造你的音频录播功能❤️

使用西瓜视频的播放器的一点见解

官网地址先看下封装效果快速上手需三步：安装、DOM占位、实例化即可完成播放器的使用。 #安装对于已有项目也可以通过 CDN 引入，代码如下：注意生产环境使用时请在CDN地址中锁定版本，CD

航羊工坊
2年前
1.6k
4
评论

使用西瓜视频的播放器的一点见解

前端如何实现音频片段的的无误差毫秒级精准播放

概述本文会讲述 Web Audio API 以及音频剪切等几种实现精准控制音频播放的方案，同时讲述了一些前端二进制、音频以及 node 服务端的知识。

o翔哥o
2年前
2.4k
24
2

口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts实践(Python3.10)

不能否认，微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的，一如ChatGPT在NLP领域的随心所欲，予取予求。君不见几乎所有的抖音营销号口播均采

刘悦的技术博客
3年前
5.5k
77
5

口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts实践(Python3.10)

OpenAI Whisper + FFmpeg + TTS：动态实现跨语言视频音频翻译

本文主要围绕着如何结合 OpenAI Whisper、FFmpeg 和 TTS（Text-to-Speech）技术，以实现将视频翻译为其他语言并更换声音的过程。

奇舞精选
2年前
6.9k
28
2

OpenAI Whisper + FFmpeg + TTS：动态实现跨语言视频音频翻译

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战，但实际上，Whisper的使用者完全可以针对中文的语音做一些优化的措施，换句话说，Whisper的“默认”形态可能在中文领域斗不过

刘悦的技术博客
2年前
1.4k
7
评论

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的

刘悦的技术博客
2年前
6.2k
20
10

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽