ai语音识别 - 用户071502901368的收藏集 - 掘金

ai语音识别

用户071502901368

更多收藏集

3篇文章 · 0订阅

字节黑科技 INFP，音频驱动的双边互动视频生成框架，实时生成，轻量又强大！

单人头像、对口型类的视频生成模型见得多了。但双边互动式视频生成还是第一次见。它就是字节最新发布的基于音频驱动的交互式头像视频生成框架：INFP。在双边对话中，存在双轨道音频，基于此可以生成任意代

开源星探
1年前
535
点赞
评论

超快文本生成音频神器：TangoFlux，AI 又解锁了新领域！让声音“由你掌控”！

在 AI 的发展浪潮中，从文本生成图像（Text-to-Image）到生成视频，技术的边界不断被突破。而生成音频（Text-to-Audio, TTA）领域，也迎来了革命性的工具：TangoFlux

开源星探
1年前
495
1
评论

Web Speech API实现语音的识别和播放

背景在进行大模型的开发项目中，有很多会涉及到语音的识别及语音的播放，现按照 Web Speech api原生支持的是，实现实现此功能，此demo仅仅在科学上网的情况下，览器默认调用的语音识别服务有网

随意_
11月前
519
3
评论