白话版，从0到1了解ChatGPT的发展脉络和带来的影响像ChatGPT这样的对话式人工智能成为了很多程序员的辅助工具，

前言

大家好，我是抹茶。
像ChatGPT这样的对话式人工智能已经与大众见面很长时间了，今天就来聊一聊它的前世今生，以及它对我们的影响。(本文将以普通人视角讲述，而非专业的学术或技术研究)。

什么是ChatGPT？ GPT的含义

ChatGPT是由OpenAI开发的基于大型语言模型（LLM）的人工智能对话系统，GPT代表“生成式预训练模型”（Generative Pre-trained Transformer）。它能够理解和生成自然语言，通过大量的文本数据进行训练，具备与人类进行自然语言交流的能力。

G代表的是Generative，也就是说它会自动生成新的内容。
P代表的是Pre-trained，这个模型在回答当前问题之前，已经针对这样的场景训练过了。
T代表的是Transformer，它好比是一个黑盒子，输入中文，会转换成英文输出，Transformer在中间起到转换的作用。

Transformer不等于预训练模型，它不能摆脱人工标注数据，即需要更多的人工干涉。而Pre-trained是在大规模的数据集上进行无监督学习，没有标签和目标，没有反馈，通过计算机程序寻找数据中隐藏的结构、找出通用的特征与知识。

1.大语音模型的“大”和“语言”指的是什么？

大指的是模型的参数量、训练数据量大。大语言模型通常指的是包含数亿、数十亿甚至上千亿参数的深度学习模型。像GPT-3的参数量有1750亿。
语言指的是自然语言，主要是指我们日常使用的各种语言，如中文、英文、法文等。大语言模型的核心任务是理解和生成自然语言文本，比如对话生成、文本翻译、文本摘要等。

因此，“大语言模型”可以理解为一个非常大规模的、用于处理和生成自然语言的深度学习模型。

2.用大白话总结ChatGPT

经过了超级大的数据量的预训练，可以理解人类语言提问的，能够自动生成很多问题答案的人工设计的智能体。

ChatGPT是横空出世的嘛？人工智能的发展史

ChatGPT是横空出世的嘛？那当然不是。它一定是站在巨人的肩膀上的。

ChatGPT是经过多类技术积累，最终形成的一个集结人类智慧的结晶。好比之前吃了4个馒头，现在吃第五个吃饱了，你能说是第五个馒头让你吃饱了，前面的馒头不重要吗？

从图中可以看出，1950年开始，人们就开始尝试用计算机程序去学习一些模版和规则。随着时代发展，模型可以处理的逻辑和数据量越来越大，是经过了多年的积累，才诞生了今天这样一个令人震撼的人工智能体。

最后一个点提到了RLHF（Reinforcement Learning from Human Feedback，基于人类反馈的强化学习）是一种结合强化学习与人类反馈来优化人工智能模型性能的算法。也就是说最近让ChatGPT在大众视野快速铺开的助力之一，是这个模型增加了对人类偏好的处理。

在ChatGPT的官网上，我们可以对回答进行评价，也就是说ChatGPT今天还在不断收集人类反馈，不断进化中。

ChatGPT背后的创始人及公司——Open AI

1.创始人Sam Altman

创始人Sam Altman之前是Y Combinat(美国创业孵化器)的总裁，然后出走创办了Open AI。

萨姆·奥尔特曼8岁时学会编程，在约翰·巴勒斯学校接受高中教育，后被斯坦福大学计算机科学专业录取。
2005年，辍学创业，同好友合作创办社交媒体公司Loopt。
2011年，创立风险基金，投资创业孵化器Y Combinator（简称YC），成为世界上最富有的企业家和天使投资人之一。
2014年，担任YC总裁，成为硅谷知名创业者。
2015年，与埃隆·马斯克等人共同创立OpenAI，于2019年担任CEO，并将OpenAI从非营利组织转向混合结构型的公司。

2.OpenAI的发展史

3.OpenAI的使命

OpenAI 成⽴之初是为了防⽌ DeepMind 作恶，其使命还旨在确保通⽤⼈⼯智能 AGI 造福全⼈类，创建⼀个安全可靠的AGI，并尽可能⼴泛和平等地共享其优势。

当时马斯克认为防⽌有⼈拿AI作恶的最好⽅式是让AI技术⺠主化并让他⼴泛使⽤，⼈⼈拥有AI 就相当于没有任何⼈或少部分⼈拥有这项技术特权。

OpenAI ⾸席技术官穆拉蒂说道：“你不能只在实验室⾥开发通⽤⼈⼯智能。”她主张，发布产品是了解⼈们希望如何使⽤和滥⽤技术的唯⼀途径。

她表示，直到发现⼈们使⽤ GPT-3 进⾏编程，OpenAI 才知道 GPT-3 最受欢迎的应⽤是编写软件代码。同样，OpenAI 最担⼼的问题是⼈们利⽤ GPT-3 ⽣成虚假的政治信息，但事实证明这只是杞⼈忧天。她表示，相反，最常⻅的恶意使⽤ GPT-3 的⾏为是制作垃圾⼴告邮件。最后，穆拉蒂表示，OpenAI 希望通过公开其技术，“最⼤程度降低真正强⼤的技术可能对社会产⽣的冲击”。

4.OpenAI的在股权架构上的创新

从⾮盈利组织转型为「利润上限」公司

OpenAI LP 的基本思想是将公司的运营和投资分离，公司的运营和研发⼯作由 OpenAI LLC（有限责任公司）负责，⽽投资⽅则成为 OpenAI LP 的有限合伙⼈，仅负责向 OpenAI 提供资⾦⽀持。这种模式相当于把 OpenAI 分成了两个部分，⼀个是运营和研发，另⼀个是资⾦和投资，从⽽更好地实现了资本和智⼒的分离。

OpenAI 最初是⾮盈利组织，因此创始⼈兼CEO，Sam Altman 是0股份。后来Sam意识到，没有更⼤资本的投⼊，OpenAl 很难⾛得很远，因此，必须引⼊更多的资本，所以必须把公司变更为盈利性公司。盈利后的利润分配将按照四个阶段进⾏：

OpenAI 的做法类似于将公司出租给微软，租期取决于 OpenAI 的盈利速度。这种确实的独⼀⽆⼆的股权机构。它表明了OpenAI对技术的理想追求，但是基于需要大资本的投入的现实，它设计了回馈资本投入的股权结构，并能陆续将股权从资本手上回收。

ChatGPT能做的50件事

如何更好使用ChatGPT ？——prompt很重要?

基于上面的信息，我们可以知道ChatGPT的好用与否，和我们给他输入怎样的提示词有很大的关系。所以这块还诞生了Prompt Engineer的岗位。

最好的提示词结构是描述一个任务，并给到样例。

所有在GPT产品化的时候，我们可以看到很多产品以业务场景维度划分和预设了很多的prompt。

1.智谱清言

2.文心一言

3.通义千问

4.chatGPT

ChatGPT的局限性

1.ChatGPT自己的回答

ChatGPT很厉害，很多问题都能一本正经的给出答案，但是它也不是无所不能的，存在着局限性，根据chatGPT自己的回答，如下：

信息时效性限制： ChatGPT的知识截至某个固定时间（比如GPT-4截至2021年），无法获取最新的新闻、数据或动态信息，除非借助外部工具。
可能产生错误信息： 尽管ChatGPT广泛覆盖信息，但有时会生成不准确或误导的回答，特别是在处理高度专业或复杂的主题时。
缺乏常识推理： 对于某些需要常识推理的任务，ChatGPT有时表现不如人类，可能会生成逻辑错误或不合常理的回复。
无个性化体验： ChatGPT无法真正“理解”用户情感或个性化需求，虽然可以根据提示调整语气或风格，但其响应没有情感或主观体验。
隐私和安全问题： 作为AI模型，ChatGPT在数据处理上存在隐私风险，可能会记录或处理敏感信息，因此不适合讨论非常个人化或机密的信息。

2.无法做到现有产品生态带来的用户体验

虽然ChatGPT的海量数据库和结构化输出可以帮忙给到很多信息，但是它无法替代现有的产品生态。什么意思？比如ChatGPT可以推荐某个地方的餐厅，但是它无法做到像美团、大众点评一样，可以直接看到更多真实的用户评价，也不能看到实时更新的图片、视频资料。（虽然说技术上可行，但是ChatGPT要服务的场景并不是这种，它更像链接知识、信息的智囊团）。

3.生成式AI不以结果为导向

ChatGPT 可以为⼀个化妆品品牌设计⼴告语，但是它不会告诉你哪⼀个更有效果。像客服机器人的场景，需要给到客户准确的标准答案，同时企业需要不断迭代的，以结果为导向的人工智能技术，而生成式AI目前还不具备基于结果的学习，同时可能会给到错误的信息，在客服场景，宁愿不回答，也不希望传递错误答案，企业也很难接受不可控的输出。

AI将取代谁的工作

根据Open AI创始人Sam Altman的看法，AI最有可能取代的反而是创造性的工作。

人工智能与人类如何相处

ChatGPT是全人类的智慧结晶，其文字的组织形式是学习的人类创建的语言规则，其训练数据也是人类投喂的。它将成为人类的工具，让人类更快的检索、分析信息，让人工智能拓展人类智能。

参考资料

极客时间公开课—《ChatGPT 从 0 到 1》

白话版，从0到1了解ChatGPT的发展脉络和带来的影响

前言