稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
ai语音识别
订阅
avatar
用户071502901368
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • 字节黑科技 INFP,音频驱动的双边互动视频生成框架,实时生成,轻量又强大!
    单人头像、对口型类的视频生成模型见得多了。 但双边互动式视频生成还是第一次见。 它就是字节最新发布的基于音频驱动的交互式头像视频生成框架:INFP。 在双边对话中,存在双轨道音频,基于此可以生成任意代
    • 开源星探
    • 8月前
    • 378
    • 点赞
    • 评论
    人工智能
  • 超快文本生成音频神器:TangoFlux,AI 又解锁了新领域!让声音“由你掌控”!
    在 AI 的发展浪潮中,从文本生成图像(Text-to-Image)到生成视频,技术的边界不断被突破。 而生成音频(Text-to-Audio, TTA)领域,也迎来了革命性的工具:TangoFlux
    • 开源星探
    • 8月前
    • 250
    • 1
    • 评论
    GitHub 人工智能
  • Web Speech API实现语音的识别和播放
    背景 在进行大模型的开发项目中,有很多会涉及到语音的识别及语音的播放,现按照 Web Speech api原生支持的是,实现实现此功能,此demo仅仅在科学上网的情况下,览器默认调用的语音识别服务有网
    • 三小河
    • 5月前
    • 224
    • 2
    • 评论
    前端