AI爆发的一年2023总结

4,451 阅读8分钟

前言

好久没有更新了,最近其实因为在准备一些其他的事情都没怎么学习AI了,所以一直没有更新一些新的干货。但是我有一直在关注这方面的新突破和新进展,下面即是我这段时间关于AI未来的思考和总结。OK,废话不多说开始我们今天的主题:AI爆发的一年2023总结

爆发起点GPT

众所周知23年是AI爆发的一年,而同样众所周知的爆发起点就是GPT的出现。准确的说应该是ChatGPT的出现引领了这波AI的爆发和发展,GPT的存在已经很久了,毕竟人家OpenAI也已经成立7,8年了,最早的GPT1,GPT2,GPT3早就存在,而我们熟知的ChatGPT是在2022年11月30日发布的。我算是ChatGPT最早的一批用户了,甚至我当时用的时候我都不知道他叫GPT,当时是2022年12月我要写一篇论文作业,在找资料的过程中发现了一个微信小程序,你问什么他就能告诉你什么,我就非常惊讶然后在上面疯狂的问问题并完成了我的论文作业,当时我真不知道这是什么GPT,我只知道好用方便并且有点震惊,因为我真的不想去百度上大海捞针去看全是广告的页面,现在来看那个小程序应该就是调了OpenAI接口做的一个小程序。其实国内对ChatGPT的反应是在2-3月份的时候有比较大的反响热度。当时我还专门写了一篇文章介绍了GPT的具体细节,有兴趣的可以看看 我眼中的chatGPT - 掘金 (juejin.cn) 那个时候我大量学习关于GPT的各种内容,不管是算法原理还是他应用的表现,我都会一一去学习尝试,所以我写了这篇文章告诉大家我用GPT的感受体会。

人工智能(AI)的爆发性发展正塑造着我们的现代世界,而在这场技术革命中,GPT(Generative Pretrained Transformer)模型扮演了举足轻重的角色。GPT系列,特别是它的最新版本,已经成为了当代AI技术的一个标志性成就。其影响可从以下几个方面深入分析:

  1. 自然语言处理的革新:GPT模型通过深度学习算法,大幅提升了机器对自然语言的理解和生成能力。这不仅使得机器能够更加流畅地与人类交流,还为文本分析、语言翻译、内容创作等领域带来了革命性的进步。
  2. 知识获取与管理:GPT通过预训练获得了大量的知识和信息,这使得它能够在无需互联网连接的情况下提供信息和解答。这种能力在教育、研究和商业智能分析中具有巨大的潜力。
  3. 创新应用的推动:GPT的出现催生了诸多创新应用,如智能写作助手、聊天机器人、代码生成工具等。这些应用正在改变人们的工作方式,提高生产力,并为新的商业模式铺平道路。
  4. 跨学科发展的催化剂:GPT作为一个多功能的平台,促进了不同领域之间的交叉合作,如人文学科与计算机科学的结合,为多学科研究提供了强大的工具。

经过一年时间的发展,时间证明ChatGPT和GPT4就是众多大语言模型里最强的。

AIGC全面爆发

随着GPT引爆全球的AI热潮,我们也看到了各式各样的AI新应用。仿佛“忽如一夜春风来,千树万树梨花开”,AIGC涵盖了使用人工智能生成文本、图像、音频和视频等内容的技术。上一节我们已经介绍了强大的GPT,这是目前最好的语言大模型,也就是生成文本部分也是最重要的部分。像国外还有llama,BERT,Claude 2,以及最近的谷歌新发布的gimini,同时国内的有百度的文心一言,讯飞的星火,清华的智谱AI等等。

我们知道这种爆发是牵一发动全身的,特别是最重要的语言大模型成功之后,他带来的不仅仅是生成文本这么简单,他带来的是整个商业格局的变化,整个内容生成内容产出的价值的变化。在三月份的时候我写过一篇关于GPT的商业调研报告ChatGPT的商业应用调研报告---LLM的星辰大海 - 掘金 (juejin.cn) 我们可以看到各行各业已经在用AI赋能他的业务或者优化他的流程,这里就不细说了,有兴趣的可以去看看报告,看看具体的实践方式。

在生图领域呢,目前就是midjourney和Stable Diffusion两个王者,虽然说包括OpenAI,百度在内的大语言模型都会加入多模态的生图能力,但是就图片的效果和表现来看,这上面两者都会是更好的选择。midjourney可能更精美,而SD可以有更加个性化的定制。我也有写过我使用midjourney的具体实践midjourney初体验--AI绘画的魔力 - 掘金 (juejin.cn)当然国内也有比较好的生图工具比如HiDream.ai,他们的生图效果在国内也是不错的,前段时间参加了他们举办的比赛拿了个三等奖,然后我就顺便把我生成的作品做出了一个系列,具体可以看看这个AIGC系列之十二星座 - 掘金 (juejin.cn)

这里做一个实验给大家展示一下:用同一个提示词生成图片,大家自己体会效果

midjourney版本

image.png

OpenAI的DALL-E版本

DALL·E 2023-12-29 18.04.24 - A futuristic electric car, showcasing sleek and modern design. The car is depicted on a smooth, open road with a cityscape in the background. The focu.png

百度文心一言版本

image.png

HiDream.ai版本

6dc654ac-8652-4c06-827b-5fe7735a72d0.png

在生成音频上,其实之前都有一些小的应用和产品,但是你尝试过你就会发现和你想的完全不相符。大部分号称AI生成音频的都是那种轻音乐,背景音或者很粗糙的产品,我一般使用过一次就会放弃。我平时喜欢听音乐,我相信大部分人也喜欢音乐,只是我们可能爱好的曲风不一样,每个人都有自己喜欢的音乐类型和音乐感觉,所以如何可以用AI帮我们生成音频音乐,按照我们需要的音乐感觉和音乐类型,那才是我们需要的。而就在最近我发现了Suno,这个平台完全符合了我对生成音频的想法,在我发现之后我立刻就去尝试使用他,发现完全的新大陆。

image.png 前几天不是圣诞节嘛,我就尝试做了一些圣诞节的歌,可以这么说完成得非常好。这里很遗憾没办法给大家展示我的歌,但是可以看看赛文老师的作品,链接就放在这了赛文乔伊的抖音 - 抖音 (douyin.com)相信我你会惊讶的。

在生成视频上,也是有应用不断涌现。其中最有名的应该就是上半年的runway和下半年的pika了。在runway的加持下你的视频一下就有了电影感,有了丰富多彩的变化,甚至变得你都不认识了。而最近大火的pika能够生成高品质的动画视频,还能根据视频进行局部修改,而你只需要进行提示词的输入。当然这方面的应用还有很多,我只讲了我比较熟悉和我用过的部分,比如HiDream.ai也有文生视频的能力,甚至还有生成3D视频的能力。这里我就不展开了,有兴趣的可以上手试试,你就知道是怎么样一方风景了。

RUNWAY生成

806298b95e6a6501c0122588931dd8e.jpg

13f728203596b3ba68bc7e1276f5536.jpg

pika生成

image.png

目前的AI加持下我们能创造一切可能

OK,总的我想说的是:目前的AI加持下我们已经能创造一切可能。我们这么想当你在文字上有GPT4的帮助,在图像上有midjourney的加持,在音频上有suno的协助,在视频画面上pika或者runway的加入。你能交出的产出和价值会不会有质的飞跃,你能实现的东西是不是可以更多。以我自己为例,我在发现我代码做不通或者看不到的时候,我首先会去问GPT。在我进行论文写作的时候我会先去和GPT进行沟通,让他生成一些东西辅助我进行思考和写作。在头像的选择上我现在都是直接AI绘画生成,不管是用国外的还是国内的都有。有时候发发抖音我会用suno帮我生成音乐,包括进行视频创作我也会使用一些pika的动画和runway的功能。AIGC这条道路上GPT帮助我们打开大门,并指引了我们方向,midjourney,snno,pika等等为我们加上了燃料,我相信未来一定更加丰富多彩,我会一直努力去做不同的尝试,我也希望可以在未来带上我的AIGC作品凯旋。

总结与展望

2023年12月《自然》杂志发布年度“科学十大影响人物”名单中包括了ChatGPT,《自然》指出:“尽管ChatGPT并非个体,也不完全符合评选标准,但我们决定破例列入,以承认生成式人工智能正在从根本上改变科学的发展轨迹。”未来千变万化,唯有坚守初心,方得始终。AI的道路上你我同行,共勉!