首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
RTE开发者社区
掘友等级
RTE 开发者社区聚焦实时互动与对话式 AI,提供技术分享、创新项目、活动直播与播客;服务 Voice Agent、Real-Time AI 的开发者与创业者。
获得徽章 0
声网
动态
文章
专栏
沸点
课程
收藏集
关注
作品
赞
29
文章 28
沸点 1
赞
29
返回
|
搜索文章
最新
热门
Seed 全双工语音大模型发布:懂倾听、抗干扰,更自然的交互;商汤发布 AI 智能体机器人「可悠」:端云协同,打通人车家跨端记忆丨日报
Meta Superintelligence Labs 推出 Muse 家族首款模型 Muse Spark。该模型采用原生多模态架构,通过重构预训练与强化学习(RL)技术栈,
又一家 AI 语音调研初创融资,Miravoice 融资 630 万美元;小米发布 Midasheng:支持长音频合成与全场景语音-音效统一建模丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有
活动招募:当 OpenClaw+硬件走向深水区,聊聊「软硬一体」新解法丨Physical AI Camp 深圳站
4 月 9 日(周四)下午,RTE Meetup 落地硬件与创客大本营——深圳。 人们往往会在短期内高估一项新技术的爆发,却在长线低估它的影响——OpenClaw 或许正是如此 。 它不只是一个现象级
Pika推数字人视频Skill:让任意智能体实现视频交互;Kaldi推TTS模型OmniVoice,支持600+语种丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的
Gradium 内测端侧 TTS:支持手机 CPU 本地运行;Fish Audio 推出 STT,支持副言语与情感标记丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点
我们的愚人节假新闻炸出了真模型
昨天 4 月 1 日愚人节,我们发布了这么一则新闻,还破了近期的阅读记录😂 简单说,我们和 AI 一起凭空造了一个能「感知语境并动态合成环境噪声的 TTS 模型」。这里可以阅读。 可能写得有些长,很多
Salesforce开源VoiceAgentRAG:双智能体解耦文档获取与响应生成;AI音频芯片第一股傅里叶登陆港交所丨日报
3 月 31 日,傅里叶成功在港交所主板上市,正式成为「AI 音频芯片第一股」,国泰君安国际及东方证券国际为联席保荐人。
用噪音打破听觉恐怖谷:RTE 开发者社区发布 RealNoise™ TTS:全球首个原生合成动态声场的语音大模型
在过去的几年里,语音 AI 行业的内卷方向始终如一:更高的采样率、更低的延迟、更纯净的音质。我们不断训练模型去剔除哪怕最微小的背景杂音,追求实验室级别的完美信噪比(SNR)。 然而,当我们在真实的实时
Qwen3.5-Omni上线,支持10小时音频输入、语义打断和音视频剧本级描述;Mistral融资8.3亿美元建设数据中心丨日报
模型采用 Thinker-Talker 架构,提供 Plus、Flash、Light 三种规格,支持 256k 长上下文,可处理超过 10 小时的音频输入,以及超过 400 秒的 720P 音视频输入
AI 牛马项圈公司新估值 20 亿美元,亚秒级实时监控;ProactiveVideoQA:首个视频多模态模型主动交互基准丨日报
目前,该项目已在 GitHub 上采用 Apache-2.0 许可证发布,提供针对 macOS、Linux 和 Windows 的自动化一键安装脚本。
下一页
个人成就
优秀创作者
文章被点赞
4,861
文章被阅读
1,355,277
掘力值
41,526
声网
关注了
2
关注者
17,050
收藏集
0
关注标签
27
加入于
2016-11-02