AI 时代最引人关注或者说最具有争议的技术是什么?我想应该就是AI 换脸技术,但是毋庸置疑这种技术正以前所未有的速度渗透到我们的生活中,引起了广泛的关注和讨论。
今天我们分享的开源项目,它是一款实时视频换脸软件,可以让你在视频或者直播中进行换脸操作,它就是:Deep-Live-Cam
Deep-Live-Cam 是什么
Deep-Live-Cam 是一个创新的 AI 应用,它利用深度学习算法,通过单张照片实现视频中的人脸实时替换。这项技术的应用范围广泛,从娱乐到教育,从艺术创作到商业广告,都有着巨大的潜力。Deep-Live-Cam现在在GitHub上完全开源,在CPU上运行,可以使用NVIDIA CUDA、Apple Silicon(CoreML)、DirectML(Windows)、OpenVINO(Intel)进行GPU加速。
Deep-Live-Cam,在发布后短短的一周时间内,增长超过2万star,可见大家对于它的关注。我们先来看一下效果,可以看到效果非常不错。
同时该软件的开发人员意识到其可能存在不道德的应用,并致力于采取预防措施。它有一个内置检查,可以防止程序用于一些你懂的视频。
技术原理
Deep-Live-Cam 背后的技术原理涉及到面部识别、特征提取和面部融合等多个步骤。它通过深度学习模型,如 GFPGANv1.4 和 inswapper_128_fp16.onnx,精确识别源图像和目标视频中的人脸特征,然后进行像素级的融合,生成逼真的换脸效果。
- GFPGANv1.4:GFPGAN 是一个腾讯开源的用来恢复照片中人脸的开源项目,目前在github上以及超过了35K star,它利用预训练人脸 GAN(例如StyleGAN2)中封装的丰富多样的先验来进行盲人脸修复。
- inswapper_128_fp16.onnx:inswapper提供支持的一键式换脸和修复。
Deep-Live-Cam 通过将多个技术融合,是得换脸能力可以落地到实时视频场景。
安装 Deep-Live-Cam
基本使用可以通过CPU运行,但速度也会非常慢。您可以按照基本安装的说明进行操作
1.运行需要
- python(推荐 3.10)
- pip
- git
- ffmpeg
- visual studio 2022 运行时 (windows)
2. 克隆仓库
<https://github.com/hacksider/Deep-Live-Cam.git>
3. 下载模型
- GFPGANv1.4
- inswapper_128_fp16.onnx
然后将这两个文件放在“ models ”文件夹中
4.安装依赖项
我们强烈建议使用 venv 以避免出现问题。
pip install -r requirements.txt
对于 MAC OS,您必须安装或升级 python-tk 包:
brew install python-tk@3.10
完成!如果您没有任何 GPU,您应该能够使用python run.py命令运行 roop。请记住,首次运行该程序时,它将下载一些模型,这可能需要一些时间,具体取决于您的网络连接。
使用 Deep-Live-Cam
执行python run.py命令将启动此窗口:
选择一张脸(包含所需脸部的图像)和目标图像/视频(您想要替换脸部的图像/视频),然后单击Start。打开文件资源管理器并导航到您选择输出的目录。您将找到一个名为的目录<video_title>,您可以在其中看到实时交换的帧。处理完成后,它将创建输出文件。就是这样。
网络摄像头模式
只需按照屏幕截图上的操作即可
- 选择一个面
- 点击直播
- 等待几秒钟(需要较长时间,通常需要 10 到 30 秒才能显示预览)
只需使用您最喜欢的屏幕截图即可像 OBS 一样进行流式传输
总结
AI的发展速度确实远远超出了人们的想象,很多科幻的内容正逐渐走进生活,但是这也带来了许多的危险和挑战,像AI换脸这类技术就属于典型的双刃剑,再带来巨大益处的同时也潜藏着风险。个人觉得还是技术本无好坏,还是看人如何去使用它。
项目信息
- 项目名称:Deep-Live-Cam
- GitHub 链接:github.com/hacksider/D…
- Star 数:25K