OpenAI 增强 ChatGPT 搜索功能
OpenAI 12Days[1] 的 12Days 活动第 8 天,官方将其命名为 ChatGPT Search Day。现在搜索功能在手机上提供更好的体验,支持视频播放和地图了。
当然,最重要的是,该功能现在免费用户也能使用了。你可以通过 search.chatgpt.com 快速打开搜索。
Midjourney 推出 Moodboards 功能,个性化模型更便捷
Midjourney[2] 推出了 Moodboards 功能,允许用户使用自己的图像集来个性化模型,有点类似 IpAdapter 风格参考或者训练风格 LoRA,用于保持画风一致。
入口在网页左侧导航栏的 personalize 菜单中,需要订阅才能使用。
Leffa:开源的可控人物图像生成框架
Leffa[3] 是一个开源的可控人物图像生成的统一框架,支持虚拟试穿和姿势转移。
代码和模型已经开源,能力非常不错,试穿效果媲美闭源的可灵。有个在线演示[4],强烈推荐大伙试试。
ObjCtrl-2.5D:开源的免训练对象运动控制技术
ObjCtrl-2.5D[5] 是一种无需训练的开源对象运动控制技术,它利用深度轨迹作为控制引导,能够实现文生视频模型中相机、物体或背景的自然运动。
代码已经开源,你们可以在在线演示[6]玩玩看,不过挺复杂的。
谷歌 Whisk:通过图像混合生成新图片
Whisk[7] 是谷歌实验室的新实验项目,用户可以通过上传或生成图像来定义主题、场景和风格,然后将它们混合生成新图片。
底层的逻辑是使用 Gemini 2 自动为图像生成 prompt,然后将其输入到 Imagen 3 中,生成最终图像。目前,该服务仅限美国用户使用。