詹姆斯·卡梅隆加入 Stability AI 董事会

33 阅读3分钟

how2draw:生成绘图过程的 LoRA

一款非常有趣的 LoRA,how2draw[1],根据提示词能生成绘图过程视频,而不仅仅是最终结果。可以预见几天后的小红书平台了,不多说了,我也赶紧发一个去。在线体验:在线体验[2]。

OpenAI推出ChatGPT高级语音功能

OpenAI官方宣布,ChatGPT Advanced Voice将在本周内向所有Plus和Team用户推出。据观察,许多用户已经体验到了这一更新。经过长时间的等待,这一功能终于面世。此外,现在还支持自定义指令、记忆、5种新语音以及改进的口音。如果尚未体验到,建议更新至最新版本。更多信息,请参阅ChatGPT Advanced Voice[3]的FAQ[4]。

字节跳动发布豆包视频生成模型

火山引擎正式发布豆包视频生成模型 PixelDance 和 Seaweed,两款大模型均基于 DiT 架构,主要面向企业市场。字节跳动正式宣告进军 AI 视频生成领域,目前除了发布的演示外,没啥特别多的信息,不过可以关注字节的“即梦 AI” 公众号,发“内测”俩字来获取申请表单链接。

我看好多人说比肩Sora,确实和Sora一样都用不上,要我说不如开源模型 Cog 来的实在,起码能用上

Gemini-1.5 更新:性能提升,价格减半

谷歌发布了 Gemini-1.5[5] 的更新版,Pro 版价格降低一半,Flash版与Pro版的速率和输出速度均提升2倍,同时在数学、长文本上下文、视觉和代码处理性能方面均有改进。用户仍可在 aistudio[6] 中直接使用。

詹姆斯·卡梅隆加入 Stability AI 董事会

著名导演詹姆斯·卡梅隆(执导了《终结者》、《泰坦尼克号》、《阿凡达》)现已正式加入 Stability AI 董事会。官方宣布,Stability AI 的 CEO 和詹姆斯·卡梅隆将于今天下午1:40(太平洋时间)在 CNBC[7] 上直播,讨论 AI 在创意产业中的未来。这标志着詹姆斯·卡梅隆成为首位公开支持生成式 AI 的奥斯卡获奖电影制作人。詹姆斯·卡梅隆在原文[8]中强调,“生成式 AI 与 CGI 的结合将是下一代技术变革的关键”。

HuggingChat 推出 MacOS 原生客户端

HuggingChat 现已推出原生 macOS 客户端,提供类似 Spotlight 的搜索体验,支持 Markdown 渲染、网页浏览和代码语法高亮。通过快捷键快速唤起,并直接输入问题,使用户体验更加便捷。目前仍处于早期 beta 阶段,能够免费使用所有顶级开源大模型,下周将增加对本地部署大模型的支持。应用目前尚未开源,未来是否开源将取决于社区反馈。

BigQwen2.5-125B:超大参数量的自我合并模型

BigQwen2.5-125B-Instruct 是一个使用 MergeKit[9] 工具对 Qwen2-72B-Instruct[10] 进行自我合并的模型。它借鉴了 Meta-Llama-3-120B-Instruct[11] 的架构设计,通过将10层的模块重复6次构建而成。在创意写作任务上表现会更好,还有一个小参数量的 BigQwen2.5-Echo-47B-Instruct[12]。作者还非常有意思的表示,他只管合并模型,也没测试,具体风险和效果你们自己测试...