首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
音视频开发之旅
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
14
文章 14
沸点 0
赞
14
返回
|
搜索文章
最新
热门
自动裁剪人脸:简化你的数字人素材准备
在做数字人时,需要对采集的数据进行预处理,然后才能进行模型训练, 预处理常用的操作有:去背景 音频重采样 视频裁剪 音频特征提取等等,今天我们来分享一个自动化脚本: 对原图/视频进行人脸检测并根据目标
音视频开发之旅(72)- AI数字人-照片说话之SadTalker
目录 1.效果展示 2.SadTalker原理学习 3.SadTalker代码流程分析 4.性能优化 5.参考资料 AI数字人目前做的最好的无疑是heygen,但是费用也是很贵,也有一些其他的商业应用
音视频开发之旅(68)-SD文生图
目录 效果展示 sd使用流程:选大模型、写关键词和设置参数 SDWebui文生图调用流程 StableDiffusion原理浅析 参考资料
音视频开发之旅(67) - 变速不变调之sonic源码分析
目录 基音周期、浊音的概念 Sonic源码分析 资料 收获 上一篇我们学习了音频变速不变调的原理以及WSOLA波形相似叠加算法进行时域压扩处理。其中在寻找相似帧方面,Sonic采用AMDF(平均幅度差
音视频开发之旅(66) - 音频变速不变调的原理
目录 声音的基本知识 时域压扩(TSM)的原理 波形相似叠加(WSOLA) 资料 收获 音频的原始pcm数据是由 采样率、采样通道数以及位宽而定。常见的音频采样率是44100HZ,即一秒内采样4410
音视频开发之旅(65) -带着问题学习实践CMake
通过Cmake进行工程化实践(以库、源码、跨平台的组织形式等多个角度实践)通过Cmake进行工程化实践(以库、源码、跨平台的组织形式等多个角度实践)
音视频开发之旅(64) - 部分android手机上编码的视频在ios上无法播放
目录 问题描述 问题分析 问题原因 问题解决 资料 收获 一、问题描述 用小米11 录制视频上传后,在iPhone的Safari浏览器或者应用的H5中无法播放,而android设备上的确实可以正常播放
音视频开发之旅(63) -Lottie 源码分析之动画与绘制
目录 动画和绘制的流程 LayerView树 ShapeLayer的分析 Lottie优劣以及rLottie、PAG的介绍 资料
音视频开发之旅(62) -Lottie 源码分析之json解析
目录 Lottie能做什么 Lottie 动画使用调用流程 Json字段介绍 解析为LottieComposition 资料 总结
音视频开发之旅(61)- 分析FFmpeg (解码部分的)常用结构体
上一篇我们分析了解封装部分的常用结构体,这篇我们来学习分析解码部分的常用结构体。 目录 断点分析ffplay解码流程及关键结构体 (解码部分)常用结构体以及之间的关系分析 资料 收获 一、断点分析ff
下一页
个人成就
文章被点赞
282
文章被阅读
109,150
掘力值
3,148
关注了
69
关注者
768
收藏集
4
关注标签
19
加入于
2015-10-22