一周AI资讯

145 阅读2分钟

2024年3月31第二期AI大事件周报

Date: March 31, 2024 news: 本期AI大事件周报涵盖了多个重要主题,包括Grok模型的升级、kimi月之暗面的长文本内测、hume情感人工智能的发布、pika支持唇形和声音导入、MoneyPrinterTurbo的开源、DALL·E编辑功能的上线、Qwen1.5-MoE的开源、Mojo AI编程语言的开源、Heygen数字人生成平台的使用方法以及大模型微调教程的视频分享。

1. Grok

马斯克开源的X同款AI模型Grok近日得到大规模升级,最大token数来到了128k,数学能力和推理能力也大幅度提升,HumanEval数据集显示Grok1.5得分超过GPT4

Untitled 1.png

2.kimi月之暗面长文本内测、阿里、百度、360争先加入长文本模式大战

打开kimiweb端首页显示长文本内测点击即可加入内测

Untitled 2.png

3.世界第一款情感人工智能hume正式发布

支持感情识别,语音对话,经笔者与他对话聊天测试,准确度和情感分析十分准确,已达到真人语音识别的效果。

www.hume.ai/ Untitled 3.png

4.pika支持唇形和声音导入

经笔者测试,上传或者生成视频后可带有音频符号的标识,原视频没有声音的可点击编辑输入想要添加的声音,不过只可添加4s声音,笔者测试为动物的声音均有着不错的效果,其他声音可自行测试。人声必须有人的形象和声音出现,否则会显示识别失败。

Untitled 4.png

5.MoneyPrinterTurbo

GitHub作者开源了类sora产品只需要输入视频主题或者关键字即可获得一个高清短视频

Untitled 5.png

6.DALL·E编辑功能

DALL.E支持编辑功能在web端和移动端均将上线该功能,只需通过描述即可添加移除图片

Untitled 6.png

Untitled 7.png

7.Qwen1.5-MoE开源

近日通义千问团队推出Qwen系列的首个MoE模型,据官方介绍仅拥有27亿参数的MOE性能却媲美Mistral 7B和Qwen1.5-7B等70亿参数模型,相比Qwen1.5-7B,Qwen1.5-MoE-A2.7B的训练成本降低了75%,推理速度则提升了1.74倍。

性能测试:

Untitled 8.png

推理成本与效率:

Untitled 9.png

8. Mojo

世界上第一款AI编程语言自去年发布时,于今日宣布开源,支持Mac 🍎, Linux, and Windows (WSL),据官网介绍Mojo融入了C于Python的特性。

Untitled 10.png

9.Heygen

打开demo.heygen.com/avatar-in-m…,输入你想要数字人生成的声音输入邮箱,视频将会被发送到你的邮箱,不到一分钟即可收到视频

Untitled 11.png

Untitled 12.png

Untitled 13.png

10.大模型傻瓜式微调教程

0011.png www.youtube.com/watch?v=rAN…

Mistral Fine Tuning for Dummies (with 16k, 32k, 128k+ Context)