AI 电影大赛冠军《RōHKI》第一集首播,热度是真的低

49 阅读2分钟

阿里开源 MIMO:AI 视频换人技术

微信截图_20240929094129.png

前几天我们介绍过 MIMO[1],这是一种专用于视频人物替换与动画生成的技术。群里大家都吐槽阿里期货开源,这不,别骂了,代码来了哈哈哈[2],不过暂时还是 WIP,还得等等。

filter_nude:NSFW 自动打码 LoRA

直接删除 NSFW 内容可能会降低模型的质量,而这个 LoRA[3] 能在几乎不影响出图效果的情况下,对 NSFW 下的二次元妹子自动打码。作者特别指出,对 SWF 和男性角色几乎没有影响(南桐落泪),但遗憾的是,这个 LoRA 目前仅适用于 SDXL-Anime 和 Animagine3 系列模型。

voice2code:语音实时生成代码

voice2code[4],由 @AK 大佬开源的小工具,基于 llama-3.2-3b-voice 技术,能够实时将语音转换为代码。GitHub 早前推出的 Copilot Voice[5] 与 VSCode 集成,同样支持语音生成代码,值得一试。老罗又一次走在前沿 “安静,吵到我用 TNT 了.jpg”

AI 电影大赛冠军《RōHKI》首播第一集

微信截图_20240929091232.png

Project Odyssey 主办的 AI 电影大赛一等奖作品《RōHKI》(熔炉)于 10 日发布了 12 分钟的第一集《Intersection[6]》(十字路口)。过去这么久我才发现,热度是真的低,不评价了,大家看视频吧。

开源 Gradio 表情编辑器

ComfyUI-AdvancedLivePortrait[7],一款实时数字人脸表情编辑器。现在,有一个类似的项目,基于 Gradio 并部署在 HF 上。不过,实际体验效果一般,使用时记得 Duplicate Space,否则速度会非常慢。你可以在这里[8]了解更多。

Runway 发布 Gen-3 Alpha Turbo 更新:支持竖屏视频生成

Runway 官方[9]宣布,Gen-3 Alpha Turbo 迎来重大更新,现已支持生成竖屏视频。此次更新不仅提升了生成速度,还增强了控制性、表现力和保真度。不过,演示视频的效果有点掉 San 值,观看时请自行斟酌。