Insert Anything:开源图片无缝插入编辑框架

201 阅读1分钟

Insert Anything:开源图片无缝插入编辑框架

Insert Anything[1] 是一个开源的图片编辑框架,能够将参考图中的人物、物体和服装等元素无缝插入到目标场景中。

效果非常不错,佬们可以在 HF 的在线演示[2]亲自试试。

腾讯 FlexiAct 视频动作克隆:真人/动漫/动物全支持

1.gif

FlexiAct[3]是腾讯 ARC 实验室推出的视频动作克隆技术。

该技术能够精准地将参考视频中的动作迁移到目标角色上,实现跨类别动作克隆,包括真人、动漫角色和动物之间的动作迁移。

演示效果不错,目前数据集和代码均已开源。

HeyGen 发布 Avatar IV 数字人

2.gif

HeyGen 发布了 Avatar IV 数字人模型,只需一张照片、一段脚本和语音,用户即可快速生成高度逼真的数字人视频。新模型采用“扩散式音频驱动表情引擎”,能根据语音的节奏、语调和情感,合成自然的面部表情和微动作,支持侧脸图像、多角度变化及唱歌节奏同步。

除了精准的唇部同步外,Avatar IV 还能'理解'语义与情感,自动生成暂停、点头等细腻动作。目前支持最长 30 秒的音频或文本脚本输入。

所有人每个月都能免费生成 3 个视频(免费用户最长10秒),官方还有一个简单的教程[4]也可以看看。