首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
人工智能
订阅
用户9901366571056
更多收藏集
微信扫码分享
微信
新浪微博
QQ
13篇文章 · 0订阅
前端如何实现VAD说话检测?
前端实现语音活动检测(VAD)已成为现代Web应用的关键技术,尤其在语音助手、视频会议和在线教育等场景中发挥着重要作用。VAD的主要功能是区分音频流中的语音和非语音部分,从而优化用户体验、减少带宽消耗
web接入科大讯飞实时语音转写模块
简介 该模块提供了与科大讯飞语音识别API的集成,实现实时语音转写功能。通过WebSocket连接,将麦克风采集的音频数据发送至科大讯飞服务器,并接收返回的识别结果。 安装 基本用法 API 参考 主
重磅!阿里、腾讯、浙大 3 大数字人项目开源,超强 AI 数字人来了!
最近,数字人技术再次迎来爆发!阿里达摩院、腾讯 & 浙江大学,以及腾讯混元团队相继开源了 3 大重磅 AI 动画项目,支持语音驱动、单张照片动画生成,甚至高质量 AI 视频生成,让数字人技术更加触手可
DeepSeek+AI数字人工具,简直王炸!2步搞定不露脸口播视频(附保姆级教程)
DeepSeek 虽然只能生成文本,但 DeepSeek 和其他工具结合,却可以实现做图表、做 PPT、画图、做视频等各种日常实用功能。 之前分享了用 DeepSeek 画图、做 PPT、做图表的教程
前端 er 如何玩转音视频流-WebRTC 技术介绍
前端 er 如何玩转音视频流-WebRTC 技术介绍 最近做了一个 AI 问答的项目,需要获取用户的摄像头,录像录音,实时语音转文字等等功能,记录一下踩过的坑。以及目前的最佳实现。
智能前端中的语音交互:React音频播放与高级前端技术全解析
深入解析了React中实现智能语音交互的全套方案,涵盖useRef操作音频DOM、React事件机制、单向数据流、TTS服务集成等核心知识点,为开发者提供实用指南
如何拥有一个无限制、可联网、带本地知识库的私人 DeepSeek?
大家好,我是 ConardLi。 今天继续来聊 DeepSeek。 前几天我发了一篇文章来介绍如何通过非官方途径使用 DeepSeek:摆脱卡顿!曲线救国使用 DeepSeek 方法大全,但是这里面的
AR口红试色|如何挑到一只适合女朋友的口红?
马上就要情人节了 相信大家都在为不知道送对象什么礼物而苦恼,不管送什么礼物加上一支口红总是没有错的,但是口红明明是“送你一支口红,每天还我一点”的浪漫,结果成了死亡芭比粉甚至口黄口绿口蓝的大型车祸现场
使用Vue3 + AR撸猫,才叫好玩
一起用代码吸猫!本文正在参与【喵星人征文活动】 先来个预告效果图开场: 聪明的你可能已经想到了,为什么只能用苹果手机才能查看,那有没有一种纯前端实现的通用的web AR技术呢? 纯前端解决方案 纯前端
开源了一个《在线换口红颜色和头发颜色》的项目,纯前端实现
本项目实现了换头发颜色和口红颜色的功能,为纯前端实现,所有用户上传的图片均在用户本地进行处理,无需担心安全问题