3分钟快速了解GPT-4

1,499 阅读3分钟

编者按:3分钟快速了解GPT-4,高效获取目前关于GPT-4的重点信息。话不多说,Enjoy!

作者 | 岳扬

01 GPT-4简介

说到GPT-4,可能你不知道,在北京时间今天凌晨OpenAI发布之前你可能已经用过了。根据这篇Bing Blog的内容,负责搜索和设备的微软公司副总裁 Yusuf Mehdi 指出五周前New Bing就是使用GPT-4了。那么下面简单介绍一下GPT-4。

ChatGPT是一个大型多模态模型,可以接受图像和文本输入,并生成文本输出。虽然在许多生活实际场景中不如人类,但GPT-4在各种专业和学术测试中表现出拥有专业人士的水平,包括通过美国律师资格考试 Uniform Bar Exam并获得了排名前10%左右的分数。

GPT-4是基于Transformer的模型,经过训练后可以预测文档中的next token。为了提高准确性和确保GPT-4遵守行为规范,OpenAI在预训练阶段使用RLHF,同时在后训练过程中控制模型。

02 GPT-4的强大功能

根据OpenAI GPT-4发布会以及OpenAI Blog的相关介绍,我们可以了解GPT-4的如下表现:

  1. GPT-4能够很好的进行文本的总结和加工。能够完成一些GPT-3.5做不了的文章总结任务,比如将一段文本总结为均由G开头字母组成的一句话,将一段文本总结成一段能够押韵的话语等。

  2. GPT-4的代码生成功能更加强大。能够用GPT-4实现一个Discord机器人,它通过先生成伪代码,然后根据伪代码一步一步实现具体功能。

  3. GPT-4可以接受图像输入,能够要求它对图片进行描述。

  4. GPT-4生成回答的文本长度大大增加,现在可以达到32000个tokens。

  5. 能够根据人类绘制的原型图草图生成HTML。这个功能真的是太强大啦!

  6. 能够实现复杂推理,比如OpenAI GPT-4发布会上用到的税务例子,他会根据你给他的税务法律等文件进行复杂推理,帮你解决税务疑问。

image.png

03 GPT-4的技术路线

目前尚未公布过多细节,基于目前笔者掌握的情况,GPT-4和ChatGPT所使用的GPT3.5技术路线应该基本一致,对原理有兴趣的朋友可以参考这篇关于ChatGPT的技术解析

不过GPT-4使用了更多优质(着重强调优质)数据进行训练,以及模型的参数更大。

最近也涌现出了许多优质的开源大语言模型,我们对此进行了整理,供小伙伴们参考。也欢迎大家持续贡献输入,一同完善更新列表。

Awesome Open Source LLMs 列表地址: github.com/BaihaiAI/ID…

图片

如果觉得有帮助,麻烦帮忙分享哦!

本文正在参加 人工智能创作者扶持计划