稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
ai实时声音对话模型
订阅
avatar
用户071502901368
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
    Open Avatar Chat是阿里开源的模块化数字人对话系统,支持文本/音频/视频多模态交互,采用可替换组件设计,平均响应延迟仅2.2秒,为开发者提供灵活高效的解决方案。
    • 蚝油菜花
    • 4月前
    • 243
    • 点赞
    • 评论
    开源 人工智能
    Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
  • 月之暗面最新开源模型!Kimi-Audio:革新多模态音频处理,统一音频理解、生成与对话!
    处理音频数据时,我们是不是经常要切换各种工具? 转写用 ASR(语音识别),转音频又得找稳定的 TTS 模型(工具)…… 几个小时前,月之暗面 Moonshot AI 正式开源了 Kimi-Audio
    • 开源星探
    • 4月前
    • 566
    • 2
    • 评论
    GitHub 人工智能 Python
  • Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言
    Fish Speech 1.5 是由 Fish Audio 推出的先进文本到语音(TTS)模型,支持13种语言,具备零样本和少样本语音合成能力,语音克隆延迟时间不到150毫秒。该模型基于深度学习技术如
    • 蚝油菜花
    • 9月前
    • 452
    • 点赞
    • 评论
    人工智能 开源
    Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言