首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
RTE开发者社区
掘友等级
RTE 开发者社区聚焦实时互动与对话式 AI,提供技术分享、创新项目、活动直播与播客;服务 Voice Agent、Real-Time AI 的开发者与创业者。
获得徽章 0
声网
动态
文章
专栏
沸点
课程
收藏集
关注
作品
赞
29
文章 28
沸点 1
赞
29
返回
|
搜索文章
最新
热门
Tavus 发布视听感知模型 Raven-1,捕捉用户语气、表情及语境;「雷格斯」获投数千万,探索「硬件+IP+AI」生态丨日报
报告指出,随着 AI 能力的提升,人类的监督方式也将发生质变——从「逐行审查」转向「基于智能体的质量控制」,即利用 AI 智能体来审查其他 AI 生成的大规模代码,人类仅需关注高风险和战略性的部分。
有奖活动丨首套语音 AI 盲盒邀你来拆!对话式 AI「黑话」周边空降,谁能看懂这些梗?
各位 RTE 开发者社区的小伙伴们,这一年,我们聊 ASR、TTS、LLM,在 TEN Framework 的各种模块里反复跳跃。在代码世界里,我们习惯了将 ASR、TTS、LLM 像积木一样拼装成强
a16z 领投 AI 伴侣 Shizuku AI:让社区参与 AI 角色成长;夸克 AI 眼镜新增直播功能丨日报
在 VSSFlow 问世之前,行业内的模型往往存在严重的偏科现象:视频转声音模型(V2S)难以生成清晰的语音,而文本转语音模型(TTS)又无法处理复杂的环境噪音。
从通用智能到场景实战:如何定义好用的「Voice Agent」?
在过去的一年里,Voice Agent 的开发者们经历了一场集体“祛魅”。一个被反复提及、逐渐成型的行业共识是:“Evals are back”(测评回归)。 这是因为行业遇到了共同的瓶颈:基础模型在
VisionClaw将OpenClaw装进智能眼镜,实时对话执行任务;Agora支撑野兽先生高清直播, 58.3万峰值并发丨日报
据《商业内幕》报道,今年硅谷的 AI 行业正出现更趋严苛的「996」式工作文化,引发业内对员工身心负担的担忧
Mistral 发布两款语音转文字模型,支持中文;苹果首款 AI 眼镜有望今年发布丨日报
Staniszewski 表示,ElevenLabs 开发的语音模型已不仅限于模拟情感与语调,而是开始与大语言模型的推理能力深度结合。他预见在未来几年,手机将回归口袋,人们得以便捷地沉浸于现实世界,通
小微商家 AI 开发平台「码上飞」:「打电话」即生成应用;ElevenLabs 新一轮融资估值飙升至 110 亿美元 丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点
面壁智能发布 MiniCPM-o 4.5,端侧全双工实时音视频交互;海马爸比推出首款 AI 魔法打印机,语音生图+即时打印丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点
Soul 开源实时数字人模型,0.87s 亚秒级延时;DeepL 发布 Voice API,支持实时语音到语音翻译丨日报
Soul App AI 团队(Soul AI Lab)昨天正式开源实时数字人生成模型 SoulX-FlashTalk。
Apple 20 亿美元收购「无声对话」公司 Q.ai,微表情识别无声指令;AI 玩具 FoloToy 连获数千万元融资丨日报
据 The Verge 消息,Meta CEO 扎克伯格日前在财报电话会上表示,人工智能(AI)将会是社交媒体的未来。
下一页
个人成就
优秀创作者
文章被点赞
4,859
文章被阅读
1,342,133
掘力值
41,317
声网
关注了
2
关注者
17,053
收藏集
0
关注标签
27
加入于
2016-11-02