首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
音视频开发之旅
音视频开发之旅
创建于2021-08-01
订阅专栏
音视频开发之旅
等 93 人订阅
共30篇文章
创建于2021-08-01
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
GPU硬件加速提升渲染流畅度
目录 1.影响流畅度的因素有哪些 2.GPU硬件加速源码分析 3.使用硬件加速提升动画流畅度 4.通过Perfetto进行效果对比 5.资料 上一篇我们介绍了整体上Android渲染机制,这篇我们继续
结合源码和Perfetto分析Android渲染机制
目录 1.一些渲染相关的问题 2.Android渲染流程 3. 结合源码分析流程-ViewRootImpl、Choreograher、 Surface、RenderThread、GraficBuffe
音视频开发之旅(87)- 视频画质评测算法之VSFA
目录 1. 背景和问题 2. VSFA算法的解决措施 3. 实验与效果 4. 源码分析 5. 实测效果与可改善点 6. 参考 一. 背景和问题 目前很多视频是用户通过移动设备拍摄生成的UGC视频, 低
音视频开发之旅(84)-图像画质评测与归因
目录 1. 图像画质评测的应用场景 2. 画质评测的方法 3. 低画质图像归因 4. 画质增强的方法 5. 资料 一、 图像画质评测的应用场景 图像画质对于提升用户体验起着重要的作用,高质量的图像,能
音视频开发之旅(83)- 腾讯音乐开源高质量唇形同步模型--MuseTalk
目录 1.效果展示 2.原理学习 3.流程分析 4.资料 一、效果展示 https://www.bilibili.com/video/BV1S1421m7oS/?vd_source=03a763fa6
音视频开发之旅(81)- 图片&视频“黑边”检测与去除
目录 1.“黑边“的场景 2. 二值化--单一颜色边缘的图像 3. canny边缘检测+霍夫直线变换--处理负责的边缘图像 4. 性能优化 5. 资料 在页面展示中,如果图片/视频有黑边,比较影响体验
音视频开发之旅(77)- 训练可泛化AI数字人的中文数据集汇总
目录 1、CMLR 2、LRW-1000 3、其他数据集 4、视频收集与处理与训练 5、资料 Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。
音视频开发之旅(76)- 图片抠图换背景-MODNet
目录 1.效果展示 2.MODNet原理学习 3.实现图像前后景分离并换背景 4. 遇到的问题和解决方案 5. 在线工具推荐 6.参考资料 一、效果展示 以上图片有SD生成,对应prompt如下 二、
音视频开发之旅(75)- AI数字人进阶--GeneFace++
目录 1.效果展示和玩法场景 2.GeneFace++原理学习 3.数据集准备以及训练的过程 5.遇到的问题与解决方案 6.参考资料 一、效果展示 AI数字人进阶--GeneFace++(1)_哔哩哔
音视频开发之旅(74)- AI数字人-实现图像无缝融合
在做数字人时,会遇到一个问题,如何把头部说话的视频和原始图片/视频合在一起,这里就涉及到很有意思的图像无缝融合的技术, 我们一起来学习下吧 目录 1. 融合的效果 2. 拉普拉斯金字塔 3. 泊松融合
自动裁剪人脸:简化你的数字人素材准备
在做数字人时,需要对采集的数据进行预处理,然后才能进行模型训练, 预处理常用的操作有:去背景 音频重采样 视频裁剪 音频特征提取等等,今天我们来分享一个自动化脚本: 对原图/视频进行人脸检测并根据目标
音视频开发之旅(72)- AI数字人-照片说话之SadTalker
目录 1.效果展示 2.SadTalker原理学习 3.SadTalker代码流程分析 4.性能优化 5.参考资料 AI数字人目前做的最好的无疑是heygen,但是费用也是很贵,也有一些其他的商业应用
音视频开发之旅(68)-SD文生图
目录 效果展示 sd使用流程:选大模型、写关键词和设置参数 SDWebui文生图调用流程 StableDiffusion原理浅析 参考资料
音视频开发之旅(67) - 变速不变调之sonic源码分析
目录 基音周期、浊音的概念 Sonic源码分析 资料 收获 上一篇我们学习了音频变速不变调的原理以及WSOLA波形相似叠加算法进行时域压扩处理。其中在寻找相似帧方面,Sonic采用AMDF(平均幅度差
音视频开发之旅(66) - 音频变速不变调的原理
目录 声音的基本知识 时域压扩(TSM)的原理 波形相似叠加(WSOLA) 资料 收获 音频的原始pcm数据是由 采样率、采样通道数以及位宽而定。常见的音频采样率是44100HZ,即一秒内采样4410
音视频开发之旅(65) -带着问题学习实践CMake
通过Cmake进行工程化实践(以库、源码、跨平台的组织形式等多个角度实践)通过Cmake进行工程化实践(以库、源码、跨平台的组织形式等多个角度实践)
音视频开发之旅(64) - 部分android手机上编码的视频在ios上无法播放
目录 问题描述 问题分析 问题原因 问题解决 资料 收获 一、问题描述 用小米11 录制视频上传后,在iPhone的Safari浏览器或者应用的H5中无法播放,而android设备上的确实可以正常播放
音视频开发之旅(63) -Lottie 源码分析之动画与绘制
目录 动画和绘制的流程 LayerView树 ShapeLayer的分析 Lottie优劣以及rLottie、PAG的介绍 资料
音视频开发之旅(62) -Lottie 源码分析之json解析
目录 Lottie能做什么 Lottie 动画使用调用流程 Json字段介绍 解析为LottieComposition 资料 总结
音视频开发之旅(61)- 分析FFmpeg (解码部分的)常用结构体
上一篇我们分析了解封装部分的常用结构体,这篇我们来学习分析解码部分的常用结构体。 目录 断点分析ffplay解码流程及关键结构体 (解码部分)常用结构体以及之间的关系分析 资料 收获 一、断点分析ff
下一页