获得徽章 0
- #每日快讯# TheMistoAI/MistoLine_Flux.dev 一个支持任意 lineart 或 outline sketches 的国产 ControlNet 模型,参数约为 1.4B。
如果你想在 ComfyUI 上使用的话,要注意它与 XLabs 的加载器和采样器不兼容,需要使用专门的节点。幸运的是,它兼容 fp16/fp8 和其他量化的 Flux 模型。
官方还预告了正在开发中的 Flux IPAdapter,可以期待一波展开评论点赞 - #每天一个知识点# Pony Diffusion 是一个基于 Stable Diffusion 的能够生成高质量拟人化动漫和卡通风格角色的模型,使用了约 260 万张图像进行训练,之前介绍的一个手办模型就是基于这个模型而来。
Pony Characters 整理了 Pony Diffusion 支持的所有 1725 个角色,包括男、女、日漫、福瑞、美漫、游戏等角色列表和提示词,非常方便。展开评论点赞 - #挑战每日一条沸点# ChatGPT 新语音泄露,本次演示来自大佬 Tibor,他非常擅长在 OpenAI 发布新内容前挖掘这些内容,包括之前的 GPT Search 也是他第一个发现的,有条件的可以关注一下他赞过评论1
- #每日快讯# 阿里通义昨天发布了新视觉语言模型 Qwen2-Vl,同样基于 Qwen2 打造,
其中官方主要用于演示和基准测试对比的 72B 模型只提供 API,能力较弱的 7B 和 2B 模型基于 Apache 2.0 协议开源,支持商用。
API 的具体价格还没出,不过你可以在这里试用闭源的 72B 模型:Qwen/Qwen2-VL,这里可以试用开源的 2B 模型,差距还是不小:MaziyarPanahi/Qwen2-VL-2B展开评论点赞 - #每日快讯# 今天早上,美国政府宣布 OpenAI 与 Anthropic 达成了一项合作协议,双方将在人工智能安全研究、测试和评估领域展开合作。
根据协议,美国国家人工智能安全研究所(USAISI)将有权在 OpenAI 和 Anthropic 发布新模型前提前访问并进行技术安全与伦理使用的监管审查。展开评论点赞 - #挑战每日一条沸点# Magic 昨晚发布了 LTM-2-Mini,第一个具有 1 亿 Token 上下文的模型,它可以在推理过程中处理相当于 1000 万行代码或 750 本小说的内容。评论点赞
- #每日快讯# 谷歌正式发布了Gems功能,目前只有 Gemini Advanced/ Gemini for Workspace 才能用,能自定义指令并且还能上传文件作为知识库。
总的来说就是对标 GPTs 来着,此外 Gemini Apps 还将引入 Imagen 3,俺还是 Imagen 3 的早期测试人员哩,其实生成效果非常的不错,但是就是没啥热度展开赞过评论1 - #每日快讯# Build-A-Scene 是一种基于文生图的技术,它利用 depth(深度)控制,用 3D boxes 替代了 2D boxes,非常适合室内设计和复杂场景生成。
目前还是期货开源,不过从演示视频来看或许对装修场景有奇效,期待开源赞过评论2 - #挑战每日一条沸点# Google DeepMind 团队开源了 RB-Modulation,一个新的风格迁移技术,就像我们熟知的 IP-Adapters 的一样,只需提供一张参考图,就能帮你轻松生成风格一致的艺术作品。
该技术适用于 StableCascade,并且可以适配 SDXL 和 Flux,不过目前官方还没有提供演示和 ComfyUI 插件,我会持续跟进社区的发展,可以先点个关注。展开赞过评论2 - #挑战每日一条沸点# 不知你是否记得字节的 Hyper-SD 项目,一种通过 LoRA 来加速图片生成的技术,现在他们正式发布了适用于 Flux 的 Hyper-FLUX.1-dev-8steps-lora.safetensors 和 Hyper-FLUX.1-dev-16steps-lora.safetensors
这里还有一个在线试用:ByteDance/Hyper-FLUX-8Steps-LoRA
推友 @bdsqlsz 使用 H100 测试后发现 8steps 模型只需 2s,速度非常的快。
此外,这里还有一个 10MB 的 rank1 版本,似乎更接近原始效果,影响更小,结果更好。展开赞过82