CogVideo 视频转视频
CogVideoX 5B 文生视频自开源后开发团队明确表示不会开源图生视频,非常的遗憾。
昨天本地 AI 运行神器的 pinokio 作者 fork 了 peanutcocktail/CogVideo 并发布了视频生视频功能,视频中演示的是“将驾驶视频变成像素游戏风格”
大伙在尝试的时候可以先用 2B 模型,速度快的多,当感觉有戏再用 5B 模型生成质量更好的。
Claude AI 即将推出 “Harmony” 的新功能
消息来源于 @testingcatalog
此功能将允许用户将聊天与本地文件同步。目前该功能还不可用,但它即将推出。
虽然,Claude AI 很 Open ,未来应该会公开系统提示词,但仍然被 @btibor91 提前挖掘出了新功能的提示词,下面的提示词用于"文件同步",我们又看到了经典的 “YOU WILL BE FIRED IF...” 这种威胁大模型的提示词,之前 OpenAI 泄露的提示词也是如此。
下面的提示词支持的操作有: antFileOpen, antFileClose, antGrep, antGetLines, antWrite 和 antStringReplace
老规矩,公众号提示词太长了影响阅读,你可以在这里找到:sanhua.himrr.com/news/f956f6…
使用 Flux schnell 探索 CLIP 文本
Latent Navigation 是一个能让我们探索 CLIP 文本如何影响输出的演示。
你可以输入两个相反的概念/风格(如夏天、冬天),再提供一个提示词,然后观察模型的输出如何在这些方向之间平滑过渡,呈现出不同的风格或概念,这个演示还会生成一个渐变长图和视频,还挺适合往社媒上发的。
FluxMusic:开源音乐生成模型
FluxMusic 是一种将当下最火、效果最好的 Flux 文生图模型技术扩展到音乐生成的开源模型,能够很好的遵循提示词生成音乐,并且更自然流畅。
你还可以在这里用 jupyter 尝试 FluxMusic-jupyter运行,官方提供了 4 种模型,small, base, large, giant,其中的 base 模型需要 14.5G VRAM,而 giant 需要 25.8G VRAM
MarioVGG: 使用 AI 生成无尽的马里奥关卡
就像前几天谷歌的 GameNGen 游戏“渲染”引擎一样,不同的是从 DOOM 换到了马里奥。
MarioVGG,又一个文生视频为可控游戏的研究,它能够生成具有连贯性的关卡,还能够模拟游戏中的物理效果和角色的动作。例如,马里奥的跳跃、奔跑、碰撞等动作。
百度文心一言 APP 更名为“文小言”
百度文心一言 App 发布了全新 4.0 版本,正式更名为"文小言",此外,官方还宣布在 9 月一整个月内可免费使用文心 4.0 大模型。
我似乎没有见过有朋友在用文心一言,别说免费 1 个月了,免费 1 年也不是使用因素。
最强配图生成工具 Napkin AI 现已支持中文
Napkin AI 是一款能将任何文本转换为插图的工具,之前只支持英文一直没拿来介绍,现已支持多种语言,包括中文,是近期内我觉得最有价值的 AI 应用之一,强烈推荐一试,现在还是免费的。
Claude AI 推出企业版
Claude for Enterprise 现已推出,原生支持 GitHub 集成,并能直接进行 AI 问答搜索,那个 Harmony 功能说不定就是为此服务的。
现在购买的话需要直接 Contact Anthropic,没有明码标价。