chatGPT火出圈的chatGPT到底是什么？有什么特点， ChatGPT是OpenAI开发的一个大型预训练语言模型。

开启掘金成长之旅！这是我参与「掘金日新计划 · 12 月更文挑战」的第8天，点击查看活动详情

火出圈的chatGPT到底是什么？

ChatGPT是OpenAI开发的一个大型预训练语言模型。它是GPT-3模型的变体，GPT-3经过训练，可以在对话中生成类似人类的文本响应。ChatGPT 旨在用作聊天机器人，我们可以对其进行微调，以完成各种任务，如回答问题、提供信息或参与对话。与许多使用预定义的响应或规则生成文本的聊天机器人不同，ChatGPT经过了训练，可以根据接收到的输入生成响应，从而生成更自然、更多样化的响应。

自从发布以来，ChatGPT可谓出尽风头，无论是让它写首押韵的诗、检查代码的bug、回答科学问题、对推特未来的发展提出建议……通通不在话下，它回复的内容每次都是随机的，但总体保持着一定的专业性和信息量，具备很强的参考意义。

那么chatGPT为什么能这么强大呢？首先，ChatGPT相比以往的主要提升点在于记忆能力，ChatGPT可以储存对话信息，延续上下文，从而实现连续对话，这在对话场景中至关重要，极大地提升了对话交互模式下的用户体验。其次，此次新加入的训练方式被称为“从人类反馈中强化学习”（ReinforcementLearning from Human Feedback，RLHF）。这一训练方法增加了人类对模型输出结果的演示，并且对结果进行了排序。具体操作上，人工智能训练者扮演对话的双方，即用户和人工智能助手，提供对话样本。在人类扮演聊天机器人的时候，会让模型生成一些建议辅助训练师撰写回复，训练师会对回复选项打分排名，将更好的结果输回到模型中，通过以上奖励策略对模型进行微调并持续迭代。除此之外，ChatGPT相比很多之前的模型还具有以下特征：

1）可承认错误，若用户指出其错误，模型会听取意见并优化答案。

2）可质疑不正确的前提，减少虚假描述，如被询问“哥伦布2015年来到美国的情景”的问题时，机器人会说明哥伦布不属于这一时代并调整输出结果。

3）因ChatGPT采用了注重道德水平的训练方式，ChatGPT在减少有害和不真实的回复上改善显著，如拒绝回答寻求霸凌他人方案的问题，指出其不正义性。

ChatGPT的背后离不开大模型、大数据、大算力。

ChatGPT成为AIGC里程碑的背后，是算力发展和数字时代形成的大数据所共同支持的大模型训练，才能实现目前的效果。