AI极客日报0825 - OpenAI最新更新 | Midjourney 推出局部重绘功能

559 阅读4分钟

我们刚刚见证了人工智能领域的另一个经典星期二。 Meta、开源 AI、OpenAI、Midjourney 和 Snap 取得了巨大发展。让我们开始吧。

最新动态

🌐 Meta带来革命性的语言AI技术

image.png

摘要:Meta近期推出了其开源人工智能模型SeamlessM4T,该模型具有跨越近100种语言的翻译和转录能力。

核心内容:

  • SeamlessM4T不仅集成了语音识别、翻译,还能完成文本到语音的转换。
  • 用户可以利用该模型在句子中自由切换不同的语言。
  • 为了达到此项技术的精准度,Meta利用数十亿的句子数据以及长达400万小时的语音数据进行了模型训练。

看点:SeamlessM4T的出现使我们对一个无语言障碍的未来充满了期待。随着技术的持续演进,类似《星际迷航》中的通用翻译器概念或将不再是遥远的科幻,而是触手可及的现实。

结论:Meta的这一进步为全球语言交流设定了新的标准。随着更多的技术突破和应用推广,我们有望迎接一个真正的多语言、无障碍的通讯时代。

🎥 CoDeF:开创AI视频编辑的新纪元

image.png

摘要:最新研究成果CoDeF,一款强大的开源AI视频编辑工具,使视频帧之间的风格传递和编辑达到前所未有的无缝程度。

核心亮点:

  • CoDeF所采用的技术,能够捕捉参考图像中的静态元素,并实时跟踪这些元素如何随视频播放的时间进行变化和形态调整。
  • 相较于现有技术,CoDeF在处理连续的视频帧时表现出卓越的稳定性,特别是对于流动的物体如水流或烟雾。
  • 该模型不仅可以让图像编辑无缝应用于整段视频,而且可以实现关键点的实时跟踪,无需额外的训练过程。

重要性:尽管人工智能已经为视频编辑领域带来了诸多创新,但CoDeF的出现可谓是此领域的一大里程碑。其功能和效果已经达到了令业内人士瞩目的地步。

结论:随着技术如CoDeF的推进,未来的视频编辑将更加智能化、高效和富有创意,为内容创作者提供了强大的后期工具。

AI工具推荐

  • 🌈 Rainbow AI-人工智能精准天气预报(链接)
  • 🪓 Pickaxe- 在网络上的任何位置嵌入人工智能(链接)
  • 📜 SEC Insights AI - 快速文档分析(链接)
  • 📊 Speak AI - 将您的语言数据快速转化为见解,无需代码(链接)
  • ✍️ Rytr - 人工智能写作助手,可帮助您在短短几秒钟内创建高质量的内容(链接)
  • ✨ Magic Studio - 在几分钟内创建令人惊叹的产品照片(链接)
  • 🐦 TweetHunter - 一体化 Twitter 增长工具,可使用 AI 创建内容、建立受众群体并安排帖子(链接)

快讯

🧠 OpenAI解锁GPT-3.5 Turbo微调

OpenAI 刚刚推出了大规模产品更新,支持对 GPT-3.5 Turbo 进行微调。它允许开发人员自定义模型,以便在特定任务上获得更好的性能。早期测试表明,经过微调的 GPT-3.5 Turbo 可以与 GPT-4 相媲美,用例包括改进的可操纵性、输出格式和自定义音调。据报道,GPT-4 的微调将于今年秋天进行。

🖌 Midjourney 首次推出局部重绘功能

Midjourney 推出了一项名为“Vary(区域)”的新修复功能,让用户可以通过突出显示某个部分并描述编辑内容来轻松修改生成图像的部分内容。它解决了重新生成或使用外部编辑工具进行细微调整的麻烦。在平台上放大图像后,可以找到新工具作为一个选项。

👻 Snapchat 准备幻想 AI 自拍制作器

Snapchat 又卷土重来,据报道正在酝酿一项名为“Dreams”的新人工智能功能,允许用户将自拍照变成富有想象力的场景。该代码包括一个“与朋友一起梦想”元素,供单个图像中的多个用户使用,以及暗示未来货币化的可购买“梦想包”。