通义千问(阿里大模型)体验感受

284 阅读2分钟

阿里通义大模型

前段时间世界人工智能大会在上海举行,我去参观感受了一下,整个感受是有点名不副实的,参展的有各种银行、车企、还有中国电信、联通三个运营商都来凑热闹了。

图片

但是也有Google、华为、阿里、腾讯、商汤这样的大厂。现场也可以体验一些大厂开发的大语言模型。例如阿里的通义千问、百度的文心一言,这些感觉生成效果都不错。还有华为的盘古大模型,尤其是盘古气象大模型,听说效果不错,研究成果还发布到了《Nature》

图片

图片

ok,今天就来介绍一下阿里的通义大模型。

图片

阿里的通义大模型是达摩院自主研发的超大规模语言模型,包括了:

  • • 通义千问(内容生成)
  • • 通义听悟(音频处理)
  • • 通义万相(AI绘画)

我申请体验了一下,没想到第二天就申请通过了,速度还是挺快的,大家也可以申请体验一下:tongyi.aliyun.com/

我体验了一下通义千问这个模型,在一些常规问题上的效果还不错,但是在逻辑理解、代码理解能力还有些不足。例如给它一个算法题,给出的代码甚至不能通过编译,并且无法完成代码的纠错。而ChatGPT给出的代码一次即可通过测试。

通义千问

图片

通义千问是类似ChatGPT一样的文本内容生成模型。

图片

做一份旅游攻略

图片

代码生成

实现一个快速排序:

图片

给它一个Leetcode算法题(最长回文子串),把它的代码测试运行一下,发现编译都报错...

图片

图片

然后我发现它给出的代码中不知道为什么要用一个int变量减去一个布尔值

图片

图片

然后它就一直重复回答...

同样的prompt,我们看下ChatGPT的效果:

图片

图片

ChatGPT给出的代码放在Leetcode上可以直接运行成功,通过测试。

图片

让ChatGPT成功指出通义千问代码的错误,并且修正后的代码运行测试通过。

图片

而通义千问对代码的理解能力却有待提高:

图片

并且UI还有显示的BUG:

图片

翻译

通义千问效果

图片

ChatGPT效果

图片

内容创作

这效果差的不是半点啊

图片

图片

通义万相

图片

另外我还体验了通义万相,是AI绘画类模型,但是生成的效果和MidJourney、Stable Diffusion这些差了一些。

图片

图片

最后

感兴趣的小伙伴通可以微信扫码试用一下

扫码注册通义听悟.png