首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
RTE开发者社区
掘友等级
RTE 开发者社区聚焦实时互动与对话式 AI,提供技术分享、创新项目、活动直播与播客;服务 Voice Agent、Real-Time AI 的开发者与创业者。
获得徽章 0
声网
动态
文章
专栏
沸点
课程
收藏集
关注
作品
赞
29
文章 28
沸点 1
赞
29
返回
|
搜索文章
RTE开发者社区
18小时前
关注
StepAudio 2.5 TTS:将语境理解能力引入语音生成全流程;阿里世界模型 Happy Oyster:实时世界创建与交互丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内...
0
评论
分享
RTE开发者社区
19小时前
关注
Visual Agent 是什么?最了解视觉智能体的一群人都来杭州了|聊聊 Context Awareness 和 Visual Agent,Physical
「现代 AI 最让我着迷的一点是,它让我们得以用数学和哲学的方式,去触碰那些隐藏在人类互动背后的无形变量:AI 让『vibes』(氛围/感觉)变得可读、可理解。」 ——Vi...
0
评论
分享
RTE开发者社区
1天前
关注
StackChan 开启国内预售,支持 AI 视听交互和二次开发;Avoko 上线 Agent-to-Agent 访谈平台,主要服务 To-Agent 产品和基
目前,该功能已集成于 Gemini App 中。用户需访问 gemini.google.com,选择提示栏中的 Pro 模型并输入相应指令即可体验。此次升级标志着 AI 辅...
0
评论
分享
RTE开发者社区
2天前
关注
Switch 健身环也能语音输入!Vibe Ring 让编程锻炼两不误;语音 AI 用户访谈平台 Mizzen Insight 融资近千万美元丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内...
0
评论
分享
RTE开发者社区
3天前
关注
超小语音模型 MOSS-TTS-Nano:0.1B 参数,支持流式和多语言;《人工智能拟人化互动服务管理暂行办法》7 月 15 日起施行丨日报
该模型目前仅供非商业学术使用,暂无计划对外发布模型权重、源代码、在线演示、API、产品或任何相关服务。...
0
评论
分享
RTE开发者社区
6天前
关注
YC 项目风向标:语音 AI 正告别「秀拟人」,走向「基础设施化」;Linq 推出新 API:AI 智能体无缝接入 FaceTime 与 iMessage丨日报
Krafton 近日宣布推出旗下全新 AI 模型品牌「Raon」,并同步在全球最大 AI 模型平台 Hugging Face 上开源四款模型:...
0
评论
分享
RTE开发者社区
7天前
关注
Seed 全双工语音大模型发布:懂倾听、抗干扰,更自然的交互;商汤发布 AI 智能体机器人「可悠」:端云协同,打通人车家跨端记忆丨日报
Meta Superintelligence Labs 推出 Muse 家族首款模型 Muse Spark。该模型采用原生多模态架构,通过重构预训练与强化学习(RL)技术栈...
0
评论
分享
RTE开发者社区
8天前
关注
又一家 AI 语音调研初创融资,Miravoice 融资 630 万美元;小米发布 Midasheng:支持长音频合成与全场景语音-音效统一建模丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域...
0
评论
分享
RTE开发者社区
13天前
关注
活动招募:当 OpenClaw+硬件走向深水区,聊聊「软硬一体」新解法丨Physical AI Camp 深圳站
4 月 9 日(周四)下午,RTE Meetup 落地硬件与创客大本营——深圳。 人们往往会在短期内高估一项新技术的爆发,却在长线低估它的影响——OpenClaw 或许正是...
0
评论
分享
RTE开发者社区
13天前
关注
Pika推数字人视频Skill:让任意智能体实现视频交互;Kaldi推TTS模型OmniVoice,支持600+语种丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内...
0
评论
分享
RTE开发者社区
14天前
关注
Gradium 内测端侧 TTS:支持手机 CPU 本地运行;Fish Audio 推出 STT,支持副言语与情感标记丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域...
0
评论
分享
RTE开发者社区
15天前
关注
我们的愚人节假新闻炸出了真模型
昨天 4 月 1 日愚人节,我们发布了这么一则新闻,还破了近期的阅读记录😂 简单说,我们和 AI 一起凭空造了一个能「感知语境并动态合成环境噪声的 TTS 模型」。这里可...
0
评论
分享
RTE开发者社区
15天前
关注
Salesforce开源VoiceAgentRAG:双智能体解耦文档获取与响应生成;AI音频芯片第一股傅里叶登陆港交所丨日报
3 月 31 日,傅里叶成功在港交所主板上市,正式成为「AI 音频芯片第一股」,国泰君安国际及东方证券国际为联席保荐人。...
0
评论
分享
RTE开发者社区
16天前
关注
用噪音打破听觉恐怖谷:RTE 开发者社区发布 RealNoise™ TTS:全球首个原生合成动态声场的语音大模型
在过去的几年里,语音 AI 行业的内卷方向始终如一:更高的采样率、更低的延迟、更纯净的音质。我们不断训练模型去剔除哪怕最微小的背景杂音,追求实验室级别的完美信噪比(SNR)...
0
评论
分享
RTE开发者社区
16天前
关注
Qwen3.5-Omni上线,支持10小时音频输入、语义打断和音视频剧本级描述;Mistral融资8.3亿美元建设数据中心丨日报
模型采用 Thinker-Talker 架构,提供 Plus、Flash、Light 三种规格,支持 256k 长上下文,可处理超过 10 小时的音频输入,以及超过 400...
0
评论
分享
RTE开发者社区
17天前
关注
AI 牛马项圈公司新估值 20 亿美元,亚秒级实时监控;ProactiveVideoQA:首个视频多模态模型主动交互基准丨日报
目前,该项目已在 GitHub 上采用 Apache-2.0 许可证发布,提供针对 macOS、Linux 和 Windows 的自动化一键安装脚本。...
0
评论
分享
RTE开发者社区
21天前
关注
Mistral 开源 Voxtral TTS,多语言+流式输出+零样本声音克隆;谷歌实时翻译功能正式登陆 iOS 平台丨日报
谷歌表示,该功能可适用于跨语言家庭交流、出境旅行等各种场景,支持全球超过 70 种语言,包括英语、中文、日语、韩语、法语、德语、西班牙语等。其不仅能进行语义翻译,还会尽可能...
1
评论
分享
RTE开发者社区
21天前
关注
Granola 融资 1.25 亿美元,从会议笔记转型企业级 AI;YC 初创尽调智能体:AI 语音访谈降本 90%丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内...
1
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
4,860
文章被阅读
1,361,105
掘力值
41,608
声网
关注了
2
关注者
17,051
收藏集
0
关注标签
27
加入于
2016-11-02