首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
音视频
订阅
yorickshan
更多收藏集
微信扫码分享
微信
新浪微博
QQ
25篇文章 · 0订阅
【在线聊天室😻】前端进阶全栈开发🔥
私聊、聊天室 Nestjs+TypeOrm(Mysql)+JWT+Socket.IO 🎉 React18/服务端渲染Nextjs+Redux-toolkit+styled-components🎉
前端 er 如何玩转音视频流-WebRTC 技术介绍
前端 er 如何玩转音视频流-WebRTC 技术介绍 最近做了一个 AI 问答的项目,需要获取用户的摄像头,录像录音,实时语音转文字等等功能,记录一下踩过的坑。以及目前的最佳实现。
使用 Web Audio API 实现实时音频可视化
在音频可视化的旅程中,我深入研究了Web Audio API和傅里叶变换,透过数学镜头,揭示了声音的频域之美,创造出实时频谱图的引人入胜的可视化体验。
用 Wavesurfer.js 和 React 快速打造你的音频录播功能❤️
本文详细介绍了如何使用 Wavesurfer.js 和 React 创建一个基本的音频录音与播放器。本教程简明易懂,有助于读者快速掌握如何利用 Wavesurfer.js 和 React 搭建音频播放
使用西瓜视频的播放器的一点见解
官网地址 先看下封装效果 快速上手 需三步:安装、DOM占位、实例化即可完成播放器的使用。 #安装 对于已有项目也可以通过 CDN 引入,代码如下: 注意 生产环境使用时请在CDN地址中锁定版本,CD
前端如何实现音频片段的的无误差毫秒级精准播放
概述 本文会讲述 Web Audio API 以及音频剪切等几种实现精准控制音频播放的方案,同时讲述了一些前端二进制、音频以及 node 服务端的知识。
口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts实践(Python3.10)
不能否认,微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的,一如ChatGPT在NLP领域的随心所欲,予取予求。君不见几乎所有的抖音营销号口播均采
OpenAI Whisper + FFmpeg + TTS:动态实现跨语言视频音频翻译
本文主要围绕着如何结合 OpenAI Whisper、FFmpeg 和 TTS(Text-to-Speech)技术,以实现将视频翻译为其他语言并更换声音的过程。
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的