又一个 Flux LoRA 画廊
之前介绍过 FLUX LoRA the Explorer[1],整理 24 款不同的 Flux LoRA ,今天的这个来自 Shakker-Labs 整理 FLUX LoRA Gallery[2],暂时包含了 7 款不同 LoRA,其中有之前很火的现实与插画融合,还有当下最火的游戏《黑神话悟空》。
ComfyUI 提示词管理工具
ComfyUI Prompt Gallery[3] 可以用来管理你提示词,帮助我们快速编写提示词,有点像 easyuse 的某个节点。
不过这个节点专门适配了新 UI,并且支持 Navimixu 大佬的 PonyXL Wildcards Vault [4],目前该项目还在积极开发中。
另外再顺带介绍一个 ComfyUI 下用来预览加载图片列表的插件 Load Image Gallery[5] ,这下图片特别多的时候也不怕不知道哪个是哪个了,如下所示:
谷歌首尾帧图生视频演示发布
来了来了,前几天介绍的 Generative Inbetweening[6] 现已发布演示,来自我们的 Space 小王子 @fffiloni 发布的:svd_keyframe_interpolation[7]
Claude AI 企业版 GitHub 集成开源平替
昨天才公布的 Claude AI 企业版最主要的功能之一现在已经有人发布了开源版本的插件,目前还没有提交到 Chrome 插件商店,不过你可以自己 clone 下玩,需要两个仓库配合的来:
- claude_github_link[8]:chrome 扩展
- claude_github_cloudflare_worker[9]: github auth
不过主要缺点是没有那么大的上下文可用,本质就是下载文件并上传,但是可以帮我们省点时间,小白用户建议等到作者发到商店时再试。
零一万物开源了 Yi-Coder 系列模型
Yi-Coder[10] 是专为编码任务而生的模型,提供 1.5B 和 9B 两种参数,虽然参数量较小,但表现优于其他 10B 参数以下的模型,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至能够与 DeepSeek-Coder 33B 相媲美。官方公众号有完整介绍,可以一看:零一万物正式开源 Yi-Coder 系列模型
字节 Loopy:又一个数字人头技术
Loopy[11] 就像百度的 Hallo[12], 阿里的 Emo[13] 等技术,能够通过语音输入,同步生成人像的面部动作,包括嘴唇、表情和头部姿势,目前只有论文,暂时没有期货开源的仓库,关注我替你持续跟进。
类似的技术开源的闭源的非常多,可以在三花上搜一下【数字人头】
面壁智能 MiniCPM 3.0 性能超 GPT-3.5
OpenBMB[14] 开源了其端侧模型小钢炮 MiniCPM3.0 4B,官方有公众号专门介绍:端侧 ChatGPT 时刻到来,不做多的介绍,宣称的主要特点有:
- 无限长文本,性能超越 Kimi
- 端侧最强 Function call,性能比肩 GPT-4o
- 量化后仅需 2.2G 内存,iPad 端侧推理能达到 18-20 tokens/s