怎么看`文心一言` VS. `GPT-4`?我没眼看

4,292 阅读9分钟

声明: 本文仅代表个人立场,发表个人观点,不接受任何辩驳、指责和批评,你说那就是你对。想要辩论的话,可以去知乎。

另本文只输出观点,不涉及技术推荐与演示,不探讨技术实现、人类伦理,且无相关利益。

观点如有雷同,不甚荣幸!

image.png

今天我们要谈论的是两个基于人工智能(AI)的两个工具,对于人工智能没有初步认知和了解的同学,可以回顾一下之前的文章:

仿生人会梦到电子羊吗? - 掘金 (juejin.cn)

它们的相同点是二者都是对于搜索引擎以及 NLP 等一些技术应用的弱 AI。接着让我们来看看对比。

GPT

ChatGPT ,是我们这段时间听过的最多的一个单词了,好像万物皆可 ChatGPTChatGPT 是由 OpenAI 基于 GPT-3.5 开发的大型语言模型聊天机器人,也可以说是问答 AI,能实现对话式地回答复杂的问题。它具有以对话形式进行交互的非凡能力,并提供可能看起来令人惊讶的人性化(也就是比较类人)的响应。至于具体的功能大家应该也都有所耳闻,比如回答一些奇奇怪怪的问题,我们还可以让 ChatGPT 帮我们写一段代码:

image.png

还有一些其他的操作,我这里就不做演示了。

知道了 ChatGPT 是个什么东西,从名字就可以看出来,ChatGPT 是一个 Chat ,也就是聊天的 GPT ,那么 GPT 是什么呢?

Generative Pre-trained Transformer (GPT) ,中文可以翻译为 生成型预训练变换模型,是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。

我们可以简单的理解为 GPT 就是 ChatGPT 大脑,所有答案都会通过这个大脑输出。

  • 2018年,GPT-1 诞生,这一年也是 NLP(自然语言处理)的预训练模型元年。GPT-1有着一定的泛化能力,能够用于和监督任务无关的NLP任务中。其常用任务包括:

    • 自然语言推理:判断两个句子的关系(包含、矛盾、中立)
    • 问答与常识推理:输入文章及若干答案,输出答案的准确率
    • 语义相似度识别:判断两个句子语义是否相关
    • 分类:判断输入文本是指定的哪个类别
  • GPT-2 于 2019 年推出,GPT-2 并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,学习目标则使用无监督预训练模型做有监督任务。除了理解能力外,GPT-2 在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。

  • 2020年,GPT-3 出现了,作为一个无监督模型(现在经常被称为自监督模型),几乎可以完成自然语言处理的绝大部分任务。作为目前最大的密集型神经网络, GPT-3能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。

  • 2023 年 2月,OpenAI 基于 GPT-3.5 创造了大型语言模型聊天机器人。

  • 2023 年 3 月 14 日,OpenAI 推出了 GPT-4。OpenAI 在其官网上写着:我们已经创造了GPT-4,这是 OpenAI 在扩展深度学习方面的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现。

随着输入和使用的增加,GPT 完成了极其迅速的迭代升级。

文心一言

3 月 16 日下午,百度正式推出自己的人工智能聊天机器人——文心一言,感兴趣的可以去百度智能云自己申请一下内测,百度做的产品,向来是令人迷惑的。如果要给 文心一言 一个版本号的话,我觉得应该算是个 0.1 版本,连个完整的 1.0 版都算不上,因为演示的就是个 PPT 嘛,发布会上的问答还都是提前录制好的,真就是 ChatGPT vs ChatPPT 了呗?

至于拿 文心一言 对标 GPT-4 ,不仅仅是我们对百度的一厢情愿,更是李彦宏对百度的一厢情愿,差不多就是这么个对标吧。

image.png

GPT 已经发展了很多年,而 文言一心 开发了多久呢?从2月份开始,也就1个多月吧……你拿什么对标?文心一言(ERNIE Bot) ,也算是大型多态模型,背后也正是基于文心大模型技术打造,虽然已经使用百度的搜索引擎训练了一番,但就百度搜素引擎的那个质量,我怕哪天用这玩意搜索“脱发怎么办”,它回答给我一堆防脱洗发水的链接……

另外,OpenAI 可是有许多海外血汗工厂的,靠着人力来完成人工智能中“人工”的那部分。而百度就国内一家血汗工厂,还天天琢磨着怎么裁员,拿啥对标?可谓是智能不够智能,人工不够人工。

image.png

至于为啥要这么赶工期的推出,李彦宏说是市场需要,所以要站出来。市场需要不需要另说,反正我是不需要。极短的时间做这么重的活儿,工程师会怎么做呢?当然是“拿来主义”优先,是我我也这么干,你可以看到连问答框都是类似的,你哪怕换个 UI 我都觉得是创新。

image.png

我们总是习惯把一切都当作利益优先,百度这些公司看到了有利可图,别人一推出赚钱了,所以要赶上去,不能落后,但是我也没见 18 年对 GPT-1 有啥对标的啊?而且百度也没把这个 0.1 的版本开源让大家瞅瞅,GPT-1GPT-2 好歹还是个开源的。

我觉得百度还是安心研究无人驾驶汽车吧,我等着买呢。要是你天天搞这些花里胡哨,只是为了追风的东西,我只想说:

image.png

如何看待这些AI?

开头我们说了,目前现有的这些 AI 都属于是弱 AI,是工具级别的,而对于工具的态度,就把它们当成是工具就好了。

甚至于有人开始焦虑,自己会不会被这些 AI 取代啊,会不会被 AI 超越啊。其实我们没必要去和 AI 竞争,因为你竞争不过,多年前人类下围棋都已经证明过了。因此,我们要竞争的对象目前还是人类自身,如何能够更好的利用它成为你的工具,而不是跟它赛跑,才是我们要重视的的问题。好比如何减少大量的重复工作、基础性工作,人类更多地进行审核和修改的部分。 GPT-4 的发布会上,它甚至可以识别一张粗糙的手稿来写一个简易的网站页面,考虑考虑是可以应用到一些场景的。

image.png

image.png

至于 AI 通过了什么测试、考试,当你把历年真题做了几百遍,并且不会忘,另外有着世界上数一数二的计算能力的时候,你上你也行,甚至觉得 AI 有着这么多的高科技加持,水平也就这。周鸿祎还说什么 AI 超过了大学生,完全是扯淡,你说某一方面还行,连一个二元一次方程式都解不明白的 AI 拿啥超过(GPT-4 好像会算了)?与其担心自己会不会被 AI 取代,还不如考虑中午点哪家的外卖。

至于人类伦理、法律法规,AI 监管这些,我们不在这里讨论。

单单作为工具这一点,微软就做的很好,他们把 GPT-4 加进了 Office 全家桶,大大提升了某些工作的工作效率,我可以快速删减文章,自己决定保留和删除的部分,可以快速把 word 转成 ppt,将 excel 数据表格快速生成各种图表等等。但最重要的是,我们要有这个意识,工具的优劣不在于工具本身,而是使用者:

高手抛出的石子,往往比一个普通忍者扔出的手里剑更具有杀伤力。

说在最后

我们已经习惯了很多年的“拿来主义”,有什么东西拿来用就行了,只要能赚钱,时间久了,自己就不会从一些基础的事情开始做,比如百度的 文言一心,甚至于前段时间谷歌的 Bard, 还没学会走,就已经要开始参加奥运会了,一步一步来,从零开始没啥不好的。点名批评芯片行业和国产浏览器。

我也希望从事软件的公司或者个人,可以更多地思考如何从思维模式和工程应用上进行创新,多考虑一些有趣的事情,而不是照虎画猫,搜肠刮肚地考虑怎么从盈利方式上创新!

一些软件公司可以将最简单的软件项目,变成一系列艰苦的流程,包含无休止的会议,以及大量“相关者”的参与。

这些公司通过每周必须完成的一系列仪式和流程,消灭掉了编程的乐趣和生产力。

—— 科技爱好者周刊

链接: