白话版,从0到1了解ChatGPT的发展脉络和带来的影响

251 阅读9分钟

前言

大家好,我是抹茶。
像ChatGPT这样的对话式人工智能已经与大众见面很长时间了,今天就来聊一聊它的前世今生,以及它对我们的影响。(本文将以普通人视角讲述,而非专业的学术或技术研究)。

什么是ChatGPT? GPT的含义

ChatGPT是由OpenAI开发的基于大型语言模型(LLM)的人工智能对话系统,GPT代表“生成式预训练模型”(Generative Pre-trained Transformer)。它能够理解和生成自然语言,通过大量的文本数据进行训练,具备与人类进行自然语言交流的能力。

image.png

G代表的是Generative,也就是说它会自动生成新的内容。
P代表的是Pre-trained,这个模型在回答当前问题之前,已经针对这样的场景训练过了。
T代表的是Transformer,它好比是一个黑盒子,输入中文,会转换成英文输出,Transformer在中间起到转换的作用。

Transformer不等于预训练模型,它不能摆脱人工标注数据,即需要更多的人工干涉。而Pre-trained是在大规模的数据集上进行无监督学习,没有标签和目标,没有反馈,通过计算机程序寻找数据中隐藏的结构、找出通用的特征与知识。

1.大语音模型的“大”和“语言”指的是什么?

  • 指的是模型的参数量、训练数据量大。大语言模型通常指的是包含数亿、数十亿甚至上千亿参数的深度学习模型。像GPT-3的参数量有1750亿。

  • 语言 指的是自然语言,主要是指我们日常使用的各种语言,如中文、英文、法文等。大语言模型的核心任务是理解和生成自然语言文本,比如对话生成、文本翻译、文本摘要等。

因此,“大语言模型”可以理解为一个非常大规模的、用于处理和生成自然语言的深度学习模型。

2.用大白话总结ChatGPT

经过了超级大的数据量的预训练,可以理解人类语言提问的,能够自动生成很多问题答案的人工设计的智能体。

ChatGPT是横空出世的嘛?人工智能的发展史

ChatGPT是横空出世的嘛?那当然不是。它一定是站在巨人的肩膀上的。

ChatGPT是经过多类技术积累,最终形成的一个集结人类智慧的结晶。好比之前吃了4个馒头,现在吃第五个吃饱了,你能说是第五个馒头让你吃饱了,前面的馒头不重要吗?

image.png

从图中可以看出,1950年开始,人们就开始尝试用计算机程序去学习一些模版和规则。随着时代发展,模型可以处理的逻辑和数据量越来越大,是经过了多年的积累,才诞生了今天这样一个令人震撼的人工智能体。

最后一个点提到了RLHF(Reinforcement Learning from Human Feedback,基于人类反馈的强化学习)是一种结合强化学习与人类反馈来优化人工智能模型性能的算法。也就是说最近让ChatGPT在大众视野快速铺开的助力之一,是这个模型增加了对人类偏好的处理

在ChatGPT的官网上,我们可以对回答进行评价,也就是说ChatGPT今天还在不断收集人类反馈,不断进化中。

image.png

ChatGPT背后的创始人及公司——Open AI

1.创始人Sam Altman

创始人Sam Altman之前是Y Combinat(美国创业孵化器)的总裁,然后出走创办了Open AI。

image.png

萨姆·奥尔特曼8岁时学会编程,在约翰·巴勒斯学校接受高中教育,后被斯坦福大学计算机科学专业录取。
2005年,辍学创业,同好友合作创办社交媒体公司Loopt。
2011年,创立风险基金,投资创业孵化器Y Combinator(简称YC),成为世界上最富有的企业家和天使投资人之一。
2014年,担任YC总裁,成为硅谷知名创业者。
2015年,与埃隆·马斯克等人共同创立OpenAI,于2019年担任CEO,并将OpenAI从非营利组织转向混合结构型的公司。

2.OpenAI的发展史

image.png

3.OpenAI的使命

OpenAI 成⽴之初是为了防⽌ DeepMind 作恶,其使命还旨在确保通⽤⼈⼯智能 AGI 造福全⼈类,创建⼀个安全可靠的AGI,并尽可能⼴泛和平等地共享其优势。

当时马斯克认为防⽌有⼈拿AI作恶的最好⽅式是让AI技术⺠主化并让他⼴泛使⽤,⼈⼈拥有AI 就相当于没有任何⼈或少部分⼈拥有这项技术特权。

image.png

OpenAI ⾸席技术官穆拉蒂说道:“你不能只在实验室⾥开发通⽤⼈⼯智能。”她主张,发布产品是了解⼈们希望如何使⽤和滥⽤技术的唯⼀途径

她表示,直到发现⼈们使⽤ GPT-3 进⾏编程,OpenAI 才知道 GPT-3 最受欢迎的应⽤是编写软件代码。同样,OpenAI 最担⼼的问题是⼈们利⽤ GPT-3 ⽣成虚假的政治信息,但事实证明这只是杞⼈忧天。她表示,相反,最常⻅的恶意使⽤ GPT-3 的⾏为是制作垃圾⼴告邮件。最后,穆拉蒂表示,OpenAI 希望通过公开其技术,“最⼤程度降低真正强⼤的技术可能对社会产⽣的冲击”

4.OpenAI的在股权架构上的创新

从⾮盈利组织转型为「利润上限」公司

OpenAI LP 的基本思想是将公司的运营和投资分离,公司的运营和研发⼯作由 OpenAI LLC(有限责任公司)负责,⽽投资⽅则成为 OpenAI LP 的有限合伙⼈,仅负责向 OpenAI 提供资⾦⽀持。这种模式相当于把 OpenAI 分成了两个部分,⼀个是运营和研发,另⼀个是资⾦和投资,从⽽更好地实现了资本和智⼒的分离。

OpenAI 最初是⾮盈利组织,因此创始⼈兼CEO,Sam Altman 是0股份。 后来Sam意识到,没有更⼤资本的投⼊,OpenAl 很难⾛得很远,因此,必须引⼊更多的资本,所以必须把公司变更为盈利性公司。 盈利后的利润分配将按照四个阶段进⾏:

image.png

OpenAI 的做法类似于将公司出租给微软,租期取决于 OpenAI 的盈利速度。这种确实的独⼀⽆⼆的股权机构。它表明了OpenAI对技术的理想追求,但是基于需要大资本的投入的现实,它设计了回馈资本投入的股权结构,并能陆续将股权从资本手上回收。

ChatGPT能做的50件事

image.png

如何更好使用ChatGPT ?——prompt很重要?

基于上面的信息,我们可以知道ChatGPT的好用与否,和我们给他输入怎样的提示词有很大的关系。所以这块还诞生了Prompt Engineer的岗位。

最好的提示词结构是描述一个任务,并给到样例。 image.png

image.png

所有在GPT产品化的时候,我们可以看到很多产品以业务场景维度划分和预设了很多的prompt。

1.智谱清言

image.png

2.文心一言

image.png

3.通义千问

image.png

4.chatGPT

image.png

ChatGPT的局限性

1.ChatGPT自己的回答

ChatGPT很厉害,很多问题都能一本正经的给出答案,但是它也不是无所不能的,存在着局限性,根据chatGPT自己的回答,如下:

  • 信息时效性限制: ChatGPT的知识截至某个固定时间(比如GPT-4截至2021年),无法获取最新的新闻、数据或动态信息,除非借助外部工具。
  • 可能产生错误信息: 尽管ChatGPT广泛覆盖信息,但有时会生成不准确或误导的回答,特别是在处理高度专业或复杂的主题时。
  • 缺乏常识推理: 对于某些需要常识推理的任务,ChatGPT有时表现不如人类,可能会生成逻辑错误或不合常理的回复。
  • 无个性化体验: ChatGPT无法真正“理解”用户情感或个性化需求,虽然可以根据提示调整语气或风格,但其响应没有情感或主观体验。
  • 隐私和安全问题: 作为AI模型,ChatGPT在数据处理上存在隐私风险,可能会记录或处理敏感信息,因此不适合讨论非常个人化或机密的信息。

2.无法做到现有产品生态带来的用户体验

虽然ChatGPT的海量数据库和结构化输出可以帮忙给到很多信息,但是它无法替代现有的产品生态。什么意思?比如ChatGPT可以推荐某个地方的餐厅,但是它无法做到像美团、大众点评一样,可以直接看到更多真实的用户评价,也不能看到实时更新的图片、视频资料。(虽然说技术上可行,但是ChatGPT要服务的场景并不是这种,它更像链接知识、信息的智囊团)。

3.生成式AI不以结果为导向

ChatGPT 可以为⼀个化妆品品牌设计⼴告语,但是它不会告诉你哪⼀个更有效果。 像客服机器人的场景,需要给到客户准确的标准答案,同时企业需要不断迭代的,以结果为导向的人工智能技术,而生成式AI目前还不具备基于结果的学习,同时可能会给到错误的信息,在客服场景,宁愿不回答,也不希望传递错误答案,企业也很难接受不可控的输出。

image.png

AI将取代谁的工作

根据Open AI创始人Sam Altman的看法,AI最有可能取代的反而是创造性的工作。

image.png

人工智能与人类如何相处

ChatGPT是全人类的智慧结晶,其文字的组织形式是学习的人类创建的语言规则,其训练数据也是人类投喂的。它将成为人类的工具,让人类更快的检索、分析信息,让人工智能拓展人类智能。

参考资料

极客时间公开课—《ChatGPT 从 0 到 1》

比较有名的AI链接