首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
音视频开发之旅
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
14
文章 14
沸点 0
赞
14
返回
|
搜索文章
音视频开发之旅
18天前
关注
音视频开发之旅(87)- 视频画质评测算法之VSFA
目录 1. 背景和问题 2. VSFA算法的解决措施 3. 实验与效果 4. 源码分析 5. 实测效果与可改善点 6. 参考 一. 背景和问题 目前很多视频是用户通过移动设...
赞
1
分享
音视频开发之旅
18天前
关注
音视频开发之旅(84)-图像画质评测与归因
目录 1. 图像画质评测的应用场景 2. 画质评测的方法 3. 低画质图像归因 4. 画质增强的方法 5. 资料 一、 图像画质评测的应用场景 图像画质对于提升用户体验起着...
赞
评论
分享
音视频开发之旅
8月前
关注
音视频开发之旅(83)- 腾讯音乐开源高质量唇形同步模型--MuseTalk
目录 1.效果展示 2.原理学习 3.流程分析 4.资料 一、效果展示 https://www.bilibili.com/video/BV1S1421m7oS/?vd_so...
赞
评论
分享
音视频开发之旅
8月前
关注
音视频开发之旅(81)- 图片&视频“黑边”检测与去除
目录 1.“黑边“的场景 2. 二值化--单一颜色边缘的图像 3. canny边缘检测+霍夫直线变换--处理负责的边缘图像 4. 性能优化 5. 资料 在页面展示中,如果图...
1
评论
分享
音视频开发之旅
8月前
关注
音视频开发之旅(77)- 训练可泛化AI数字人的中文数据集汇总
目录 1、CMLR 2、LRW-1000 3、其他数据集 4、视频收集与处理与训练 5、资料 Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的...
赞
评论
分享
音视频开发之旅
8月前
关注
音视频开发之旅(76)- 图片抠图换背景-MODNet
目录 1.效果展示 2.MODNet原理学习 3.实现图像前后景分离并换背景 4. 遇到的问题和解决方案 5. 在线工具推荐 6.参考资料 一、效果展示 以上图片有SD生成...
赞
评论
分享
音视频开发之旅
8月前
关注
音视频开发之旅(75)- AI数字人进阶--GeneFace++
目录 1.效果展示和玩法场景 2.GeneFace++原理学习 3.数据集准备以及训练的过程 5.遇到的问题与解决方案 6.参考资料 一、效果展示 AI数字人进阶--Gen...
1
评论
分享
音视频开发之旅
9月前
关注
音视频开发之旅(74)- AI数字人-实现图像无缝融合
在做数字人时,会遇到一个问题,如何把头部说话的视频和原始图片/视频合在一起,这里就涉及到很有意思的图像无缝融合的技术, 我们一起来学习下吧 目录 1. 融合的效果 2. 拉...
4
1
分享
音视频开发之旅
9月前
关注
自动裁剪人脸:简化你的数字人素材准备
在做数字人时,需要对采集的数据进行预处理,然后才能进行模型训练, 预处理常用的操作有:去背景 音频重采样 视频裁剪 音频特征提取等等,今天我们来分享一个自动化脚本: 对原图...
赞
评论
分享
音视频开发之旅
9月前
关注
音视频开发之旅(72)- AI数字人-照片说话之SadTalker
目录 1.效果展示 2.SadTalker原理学习 3.SadTalker代码流程分析 4.性能优化 5.参考资料 AI数字人目前做的最好的无疑是heygen,但是费用也是...
5
评论
分享
音视频开发之旅
9月前
关注
音视频开发之旅(68)-SD文生图
目录 效果展示 sd使用流程:选大模型、写关键词和设置参数 SDWebui文生图调用流程 StableDiffusion原理浅析 参考资料...
赞
评论
分享
音视频开发之旅
关注了
张拭心
音视频开发之旅
关注了标签
音视频开发
音视频开发之旅
赞了这篇文章
小红军
3年前
关注
短视频多清晰度调研
1. 什么是自适应码流 自适应码流,是一种将视频内容制作成多种分辨率版本,然后终端播放器自动选择版本播放的技术。 如图所示,内容服务器在提供视频内容之前,预先将视频转成了流...
4
2
分享
音视频开发之旅
2年前
关注
音视频开发之旅(67) - 变速不变调之sonic源码分析
目录 基音周期、浊音的概念 Sonic源码分析 资料 收获 上一篇我们学习了音频变速不变调的原理以及WSOLA波形相似叠加算法进行时域压扩处理。其中在寻找相似帧方面,Son...
1
评论
分享
音视频开发之旅
关注了
却把清梅嗅
音视频开发之旅
2年前
关注
音视频开发之旅(66) - 音频变速不变调的原理
目录 声音的基本知识 时域压扩(TSM)的原理 波形相似叠加(WSOLA) 资料 收获 音频的原始pcm数据是由 采样率、采样通道数以及位宽而定。常见的音频采样率是4410...
9
评论
分享
音视频开发之旅
关注了
网易云音乐技术团队
音视频开发之旅
2年前
关注
音视频开发之旅(65) -带着问题学习实践CMake
通过Cmake进行工程化实践(以库、源码、跨平台的组织形式等多个角度实践)通过Cmake进行工程化实践(以库、源码、跨平台的组织形式等多个角度实践)...
1
评论
分享
音视频开发之旅
2年前
关注
音视频开发之旅(64) - 部分android手机上编码的视频在ios上无法播放
目录 问题描述 问题分析 问题原因 问题解决 资料 收获 一、问题描述 用小米11 录制视频上传后,在iPhone的Safari浏览器或者应用的H5中无法播放,而andro...
6
1
分享
下一页
个人成就
文章被点赞
265
文章被阅读
84,193
掘力值
3,008
关注了
69
关注者
715
收藏集
4
关注标签
19
加入于
2015-10-22