Rembg 图片去背景工具 懒人整合包 优化可视化界面和添加模型 cpu可用 gpu可用

0 阅读4分钟

前言

这个Rembg去除背景懒人包是我自己制作的第一个懒人包

当时为了制作youtube带有真人头像的封面,需要保留人像,去除背景,然后搜索到这个好用的ai开源项目

也是为数不多的可以使用cpu也能流畅操作的项目,效果很不错,关键还是开源免费

作为一个高频使用的工具,也是我电脑没有3060显卡的时候,可以制作的懒人包

下图是实际测试效果

懒人包更新

我预期的懒人整合包

  • 可以离线使用,并且不会发送一些奇奇怪怪的请求,完全断网,不会动态下载模型和其他内容,也不会上报数据等
  • 可以兼容大多数系统环境,也就是电脑没有安装python等一些编程环境,也可以正常运行,或者说是纯净新系统环境,什么都不做也可以正常运行
  • 可以兼容大多数设备,目前主要是兼容自己的3060显卡,其他的I卡,A卡,甚至50系列N卡显卡,暂时没有设备测试,也就没办法兼容
  • 基本的功能和易用的ui,命令行和api的方式主要是面向开发人员,一般使用场景用gui和网页ui操作更为方便(进阶为批量操作和流式处理等)

作为第一个懒人包,后来发现一些问题

  • 离线使用,可能模型并没有使用本地模型,而是仍然请求线上模型(本次更新已断网测试,并且从原来的单个模型改为rembg支持的6个全模型,满足大多数使用场景)
  • 环境依赖调整,原来的懒人包分发,可以正常启动,但是后面需要优化时,发现很难添加新的环境依赖(这个优化关于gui,因为需要把fastapi的界面改为gradio网页,可视化的操作),所以重新设置了懒人包环境,新增gradio依赖库
  • 交互优化,也就是原来的英文fastapi api文档形式,改为gradio界面,可以网页直接操作图片处理,直接下载图片,并且中文友好,设置多模型下拉选择,设置webp转png下载等
  • 设置浏览器自启动网页,一个简单的交互,虽然使用说明里会有如何打开网页,以及网址,但是自动打开网页更为方便(后期也可以改为exe gui客户端,不依赖网页,但是前期网页更方便)
  • 添加gpu支持,原来第一版是cpu支持,预期后面添加gpu但是一直没时间更新,现在即优化了cpu懒人包,也添加了gpu懒人包,没有显卡的可以用cpu,有显卡的可以gpu加速(后期对于图片等显存类型也会考虑分开cpu和gpu两种懒人包)

下图为原来的fastapi的使用方式

当前懒人包

我预期的图片处理流程交互

  • 顶部是标题文字介绍
  • 中间左侧是图片选择,右侧是图片处理结果显示
  • 底部左侧是模型选择和操作按钮,右侧是png下载

不仅仅是rembg这个交互,后面其他图片也优先使用类似的交互

Tips

点击此处 网盘下载

目前懒人整合包还有一些可以优化的地方,也是后期其他懒人整合包都会被提到的一些地方

是否支持批量?

批量处理图片,显然是专业的人需要的业务操作,目前默认前期懒人整合包都不支持批量处理,因为这种场景我用的少,且一般批量都需要单独添加一些代码处理,这个功能属于优化,需要排到待处理事物,前期优先保证功能正常就可以了

是否支持流式?

主要是音频等场景,和批量一样,默认非高频非必须的基本场景,都属于优化项,排列到待处理事物,后期统一优化

是否支持I卡,A卡,50系N卡?

目前只自测3060显卡,其他都需要自行下载后测试,因为没有对应的设备,无法编译安装和自测,还有同样的,是否支持mac和linux,也是默认支持win11,mac没设备,linux比较小众,所以都不是常规选项,也是待处理,有时间再说