首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
evan2020
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
evan2020
16天前
关注
Qwen3 ASR 流式转写 Docker 懒人整合包
前言 本文是第二个docker懒人包,依旧是win兼容问题,不得不用docker 这个懒人包有40GB左右,在docker容器里,环境依赖和模型都在,界面为官方的流式dem...
0
评论
分享
evan2020
17天前
关注
sam3 提示词 图片分割和视频分割 docker 懒人整合包
前言 因为win兼容性问题,改为docker懒人包 第一次把镜像打包了,一些第三方依赖不在,依旧报错 第二次才把带环境的容器打包,这样一个极简的可以正常的工作的docker...
0
评论
分享
evan2020
17天前
关注
SAM3 提示词 视频分割 ComfyUI 懒人整合包
前言 上期记录了SAM3 提示词 图片分割 本文更新SAM3 提示词 视频分割 但是在视频分割遇到一些兼容性问题 报错 easy sam3VideoSegmentation...
0
评论
分享
evan2020
18天前
关注
SAM3 提示词 图片分割 ComfyUI 懒人整合包
SAM3 github地址: https://github.com/facebookresearch/sam3 Meta AI SAM 3 模型介绍 Meta AI 开源的...
0
评论
分享
evan2020
19天前
关注
Qwen3-ASR 多语言语音音乐歌曲识别 懒人整合包 重新安装
前言 从之前的fastapi转gradio界面,已经重新打包了3个左右的懒人包 核心是为了把编程api转为可视化操作交互网页,更加方便,同时也是为了重新优化项目结构,方便后...
0
评论
分享
evan2020
21天前
关注
PaddleOCR-VL-1.5 PDF转MD 懒人整合包 界面微调
前言 本期依旧是把fastapi的界面改为gradio界面 原来的fastapi适合api调用,现在的gradio适合界面交互操作 本期的更新为 只保留PDF转MD和图片转...
0
评论
分享
evan2020
22天前
关注
paddleocr PP-StructureV3 pdf转md 懒人整合包 gpu可用
前言 上一期内容记录了paddleocr PP-StructureV3 pdf转md 懒人整合包 cpu可用 本文主要是记录把paddleocr PP-StructureV...
0
评论
分享
evan2020
24天前
关注
paddleocr PP-StructureV3 pdf转md 懒人整合包 cpu可用 交互界面调整
前言 本文依旧是懒人包的优化更新 之前最大的问题就是使用fastapi这种偏向编程交互的操作方式 适合api调用,不太适合gui界面可视化操作,现在统一把fastapi改为...
0
评论
分享
evan2020
25天前
关注
Rembg 图片去背景工具 懒人整合包 优化可视化界面和添加模型 cpu可用 gpu可用
前言 这个Rembg去除背景懒人包是我自己制作的第一个懒人包 当时为了制作youtube带有真人头像的封面,需要保留人像,去除背景,然后搜索到这个好用的ai开源项目 也是为...
0
评论
分享
evan2020
1月前
关注
FireRed-Image-Edit 一键衣物提取 懒人整合包
FireRed-Image-Edit github地址:https://github.com/FireRedTeam/FireRed-Image-Edit FireRed-...
0
评论
分享
evan2020
1月前
关注
开源免费人像抠图神器!CPU也能跑的RMBG去背景(懒人一键搞定版)
rembg github地址:https://github.com/danielgatis/rembg 截至到目前,22.1k star 它是一款用于去除图片背景的工具,比...
0
评论
分享
evan2020
1月前
关注
SoulX-FlashHead 实时图片数字人生成器 8GB显存可用 一键懒人整合包下载
SoulX-FlashHead github地址:https://github.com/Soul-AILab/SoulX-FlashHead 这是一个有soul推出的开源的...
0
评论
分享
evan2020
1月前
关注
qwen3-tts 文字转语音 懒人整合包
Qwen3-TTS github地址:https://github.com/QwenLM/Qwen3-TTS Qwen3-TTS是通义千问团队开发的开源语音合成模型系列,支...
0
评论
分享
evan2020
1月前
关注
LatentSync 开源数字人视频对口型 懒人整合包
LatentSync github地址:https://github.com/bytedance/LatentSync LatentSync 是开源唇形同步(Lip Sy...
0
评论
分享
evan2020
1月前
关注
IOPaint 开源ai去水印 去除背景 懒人整合包
IOPaint github地址:https://github.com/Sanster/IOPaint IOPaint 是一个 开源的 AI 图像修复与编辑工具,主要用于 ...
0
评论
分享
evan2020
1月前
关注
Wan2.2-Animate动作迁移 图片同步视频姿态 懒人整合包
Wan2.2-Animate github地址:https://github.com/Wan-Video/Wan2.2 Wan2.2 是一个开源的 AI视频生成模型框架,主...
0
评论
分享
evan2020
1月前
关注
paddleOcr 懒人整合包 添加pdf和图片转markdown 添加GPU支持
PP-StructureV3 github地址:https://github.com/PaddlePaddle/PaddleOCR PP-StructureV3——复杂文档...
0
评论
分享
evan2020
1月前
关注
PaddleOCR-VL-1.5 懒人整合包 支持PDF转MD 比PP-StructureV3更精准
PaddleOCR-VL-1.5 github地址:https://github.com/PaddlePaddle/PaddleOCR PaddleOCR-VL-1.5:0...
0
评论
分享
evan2020
1月前
关注
小红书FireRed-OCR 2B 图片和PDF转md 懒人整合包
FireRed-OCR github地址:https://github.com/FireRedTeam/FireRed-OCR FireRed-OCR是一个系统化的框架,旨...
0
评论
分享
evan2020
1月前
关注
fashn-vton-1.5 一键换装 懒人整合包
fashn-vton-1.5 github地址:https://github.com/fashn-AI/fashn-vton-1.5 项目定位:是什么? fashn-vto...
0
评论
分享
下一页
个人成就
文章被点赞
213
文章被阅读
143,550
掘力值
2,398
关注了
0
关注者
49
收藏集
1
关注标签
139
加入于
2017-07-16