openai 的模型概述【插件翻译版】

369 阅读20分钟

Models 模型

Overview 概述

The OpenAI API is powered by a diverse set of models with different capabilities and price points. You can also make limited customizations to our original base models for your specific use case with fine-tuning.
OpenAI API 由具有不同功能和价格点的多种模型提供支持。您还可以通过微调,针对您的特定用例对我们的原始基本模型进行有限的定制。

MODELS 楷模DESCRIPTION 描述
GPT-4  GPT-4A set of models that improve on GPT-3.5 and can understand as well as generate natural language or code 一组改进 GPT-3.5 的模型,可以理解并生成自然语言或代码
GPT-3.5  GPT-3.5A set of models that improve on GPT-3 and can understand as well as generate natural language or code 一组改进 GPT-3 的模型,可以理解并生成自然语言或代码
DALL·E  达尔·EA model that can generate and edit images given a natural language prompt 可以在自然语言提示下生成和编辑图像的模型
Whisper  耳语A model that can convert audio into text 可以将音频转换为文本的模型
Embeddings 嵌入A set of models that can convert text into a numerical form 一组可以将文本转换为数字形式的模型
Moderation 适度A fine-tuned model that can detect whether text may be sensitive or unsafe 可以检测文本是否敏感或不安全的微调模型
GPT-3Legacy GPT-3旧版A set of models that can understand and generate natural language 一组能够理解和生成自然语言的模型
Deprecated 已弃用A full list of models that have been deprecated 已弃用的模型的完整列表

We have also published open source models including Point-EWhisperJukebox, and CLIP.
我们还发布了开源模型,包括 Point-E、Whisper、Jukebox 和 CLIP。

Visit our model index for researchers to learn more about which models have been featured in our research papers and the differences between model series like InstructGPT and GPT-3.5.
请访问我们的模型索引,以便研究人员详细了解我们的研究论文中介绍了哪些模型以及 InstructGPT 和 GPT-3.5 等模型系列之间的差异。


Continuous model upgrades 型号持续升级

Based on developer feedback, we are extending support for gpt-3.5-turbo-0301 and gpt-4-0314 models in the OpenAI API until at least June 13, 2024. We've updated our June 13 blog post with more details.
根据开发人员的反馈,我们将对 OpenAI API 中的 gpt-3.5-turbo-0301 和 gpt-4-0314 模型的支持至少延长到 2024 年 6 月 13 日。我们更新了 6 月 13 日的博客文章,提供了更多详细信息。

With the release of gpt-3.5-turbo, some of our models are now being continually updated. gpt-3.5-turbogpt-4, and gpt-4-32k point to the latest model version. You can verify this by looking at the response object after sending a ChatCompletion request. The response will include the specific model version used (e.g. gpt-3.5-turbo-0613).
随着 gpt-3.5-turbo 的发布,我们的一些模型正在不断更新。 gpt-3.5-turbo 、 gpt-4 和 gpt-4-32k 指向最新的模型版本。您可以通过发送 ChatCompletion 请求后查看响应对象来验证这一点。响应将包括所使用的特定模型版本(例如 gpt-3.5-turbo-0613 )。

We also offer static model versions that developers can continue using for at least three months after an updated model has been introduced. With the new cadence of model updates, we are also giving people the ability to contribute evals to help us improve the model for different use cases. If you are interested, check out the OpenAI Evals repository.
我们还提供静态模型版本,开发人员可以在引入更新模型后继续使用至少三个月。随着模型更新的新节奏,我们还让人们能够贡献评估,以帮助我们针对不同用例改进模型。如果您有兴趣,请查看 OpenAI Evals 存储库。

The following models are the temporary snapshots, we will announce their deprecation dates once updated versions are available. If you want to use the latest model version, use the standard model names like gpt-4 or gpt-3.5-turbo.
以下型号是临时快照,一旦有更新版本,我们将宣布其弃用日期。如果您想使用最新的模型版本,请使用标准模型名称,例如 gpt-4 或 gpt-3.5-turbo 。

MODEL NAME 型号名称DISCONTINUATION DATE 停药日期REPLACEMENT MODEL 替换型号
gpt-3.5-turbo-0301at earliest 06/13/2024 最早 2024 年 6 月 13 日gpt-3.5-turbo-0613
gpt-4-0314 GPT-4-0314at earliest 06/13/2024 最早 2024 年 6 月 13 日gpt-4-0613 GPT-4-0613
gpt-4-32k-0314 GPT-4-32K-0314at earliest 06/13/2024 最早 2024 年 6 月 13 日gpt-4-32k-0613 GPT-4-32K-0613

Learn more about model deprecation on our deprecation page.
在我们的弃用页面上了解有关模型弃用的更多信息。

GPT-4 GPT-4

GPT-4 is currently accessible to those who have made at least one successful payment through our developer platform.
目前,通过我们的开发者平台至少成功支付过一次的用户可以使用 GPT-4。

GPT-4 is a large multimodal model (accepting text inputs and emitting text outputs today, with image inputs coming in the future) that can solve difficult problems with greater accuracy than any of our previous models, thanks to its broader general knowledge and advanced reasoning capabilities. Like gpt-3.5-turbo, GPT-4 is optimized for chat but works well for traditional completions tasks using the Chat Completions API. Learn how to use GPT-4 in our GPT guide.
GPT-4 是一个大型多模态模型(今天接受文本输入并发出文本输出,未来将出现图像输入),由于其更广泛的常识和先进的推理,它可以比我们以前的任何模型更准确地解决难题能力。与 gpt-3.5-turbo 一样,GPT-4 针对聊天进行了优化,但也适用于使用聊天完成 API 的传统完成任务。在我们的 GPT 指南中了解如何使用 GPT-4。

LATEST MODEL 最新款DESCRIPTION 描述MAX TOKENS 最大代币数TRAINING DATA 训练数据
gpt-4 GPT-4More capable than any GPT-3.5 model, able to do more complex tasks, and optimized for chat. Will be updated with our latest model iteration 2 weeks after it is released. 比任何 GPT-3.5 模型都更强大,能够执行更复杂的任务,并针对聊天进行了优化。将在发布后两周更新我们最新的模型迭代。8,192 tokens 8,192 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-4-0613 GPT-4-0613Snapshot of gpt-4 from June 13th 2023 with function calling data. Unlike gpt-4, this model will not receive updates, and will be deprecated 3 months after a new version is released. 2023 年 6 月 13 日的 gpt-4 快照,包含函数调用数据。与 gpt-4 不同的是,该模型不会收到更新,并将在新版本发布 3 个月后弃用。8,192 tokens 8,192 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-4-32k gpt-4-32kSame capabilities as the standard gpt-4 mode but with 4x the context length. Will be updated with our latest model iteration. 与标准 gpt-4 模式具有相同的功能,但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。32,768 tokens 32,768 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-4-32k-0613 GPT-4-32K-0613Snapshot of gpt-4-32 from June 13th 2023. Unlike gpt-4-32k, this model will not receive updates, and will be deprecated 3 months after a new version is released. 2023 年 6 月 13 日的 gpt-4-32 快照。与 gpt-4-32k 不同,此模型不会收到更新,并将在新版本发布 3 个月后弃用。32,768 tokens 32,768 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-4-0314 (Legacy) gpt-4-0314(旧版)Snapshot of gpt-4 from March 14th 2023 with function calling data. Unlike gpt-4, this model will not receive updates, and will be deprecated on June 13th 2024 at the earliest. 2023 年 3 月 14 日的 gpt-4 快照,包含函数调用数据。与 gpt-4 不同,此模型不会收到更新,并且最早将于 2024 年 6 月 13 日弃用。8,192 tokens 8,192 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-4-32k-0314 (Legacy) gpt-4-32k-0314(旧版)Snapshot of gpt-4-32 from March 14th 2023. Unlike gpt-4-32k, this model will not receive updates, and will be deprecated on June 13th 2024 at the earliest. 2023 年 3 月 14 日的 gpt-4-32 快照。与 gpt-4-32k 不同,此模型不会收到更新,最早将于 2024 年 6 月 13 日弃用。32,768 tokens 32,768 个代币Up to Sep 2021 截至 2021 年 9 月

For many basic tasks, the difference between GPT-4 and GPT-3.5 models is not significant. However, in more complex reasoning situations, GPT-4 is much more capable than any of our previous models.
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都更有能力。

GPT-3.5 GPT-3.5

GPT-3.5 models can understand and generate natural language or code. Our most capable and cost effective model in the GPT-3.5 family is gpt-3.5-turbo which has been optimized for chat using the Chat Completions API but works well for traditional completions tasks as well.
GPT-3.5模型可以理解并生成自然语言或代码。我们在 GPT-3.5 系列中功能最强大且最具成本效益的模型是 gpt-3.5-turbo ,它已针对使用聊天完成 API 的聊天进行了优化,但也适用于传统的完成任务。

LATEST MODEL 最新款DESCRIPTION 描述MAX TOKENS 最大代币数TRAINING DATA 训练数据
gpt-3.5-turboMost capable GPT-3.5 model and optimized for chat at 1/10th the cost of text-davinci-003. Will be updated with our latest model iteration 2 weeks after it is released. 最强大的 GPT-3.5 模型,并针对聊天进行了优化,成本仅为 text-davinci-003 的 1/10。将在发布后两周更新我们最新的模型迭代。4,096 tokens 4,096 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-3.5-turbo-16kSame capabilities as the standard gpt-3.5-turbo model but with 4 times the context. 与标准 gpt-3.5-turbo 模型具有相同的功能,但上下文是其 4 倍。16,384 tokens 16,384 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-3.5-turbo-0613Snapshot of gpt-3.5-turbo from June 13th 2023 with function calling data. Unlike gpt-3.5-turbo, this model will not receive updates, and will be deprecated 3 months after a new version is released. 2023 年 6 月 13 日的 gpt-3.5-turbo 快照,包含函数调用数据。与 gpt-3.5-turbo 不同的是,该模型不会收到更新,并将在新版本发布 3 个月后弃用。4,096 tokens 4,096 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-3.5-turbo-16k-0613Snapshot of gpt-3.5-turbo-16k from June 13th 2023. Unlike gpt-3.5-turbo-16k, this model will not receive updates, and will be deprecated 3 months after a new version is released. 2023 年 6 月 13 日的 gpt-3.5-turbo-16k 快照。与 gpt-3.5-turbo-16k 不同,此模型不会收到更新,并将在新版本发布 3 个月后弃用。16,384 tokens 16,384 个代币Up to Sep 2021 截至 2021 年 9 月
gpt-3.5-turbo-0301 (Legacy) gpt-3.5-turbo-0301(旧版)Snapshot of gpt-3.5-turbo from March 1st 2023. Unlike gpt-3.5-turbo, this model will not receive updates, and will be deprecated on June 13th 2024 at the earliest. 2023 年 3 月 1 日的 gpt-3.5-turbo 快照。与 gpt-3.5-turbo 不同,此模型不会收到更新,最早将于 2024 年 6 月 13 日弃用。4,096 tokens 4,096 个代币Up to Sep 2021 截至 2021 年 9 月
text-davinci-003 (Legacy) 文本-​​davinci-003(旧版)Can do any language task with better quality, longer output, and consistent instruction-following than the curie, babbage, or ada models. Also supports some additional features such as inserting text. 与居里、巴贝奇或 ada 模型相比,可以以更好的质量、更长的输出和一致的指令遵循来完成任何语言任务。还支持一些附加功能,例如插入文本。4,097 tokens 4,097 个代币Up to Jun 2021 截至 2021 年 6 月
text-davinci-002 (Legacy) 文本-​​davinci-002(旧版)Similar capabilities to text-davinci-003 but trained with supervised fine-tuning instead of reinforcement learning 与 text-davinci-003 类似的功能,但通过监督微调而不是强化学习进行训练4,097 tokens 4,097 个代币Up to Jun 2021 截至 2021 年 6 月
code-davinci-002 (Legacy) 代码-davinci-002(旧版)Optimized for code-completion tasks 针对代码完成任务进行了优化8,001 tokens 8,001 个代币Up to Jun 2021 截至 2021 年 6 月

We recommend using gpt-3.5-turbo over the other GPT-3.5 models because of its lower cost and improved performance.
我们建议使用 gpt-3.5-turbo 而不是其他 GPT-3.5 模型,因为它的成本更低且性能更高。

OpenAI models are non-deterministic, meaning that identical inputs can yield different outputs. Setting temperature to 0 will make the outputs mostly deterministic, but a small amount of variability may remain.
OpenAI 模型是非确定性的,这意味着相同的输入可能会产生不同的输出。将温度设置为 0 将使输出大部分具有确定性,但可能会保留少量的可变性。

DALL·E 达尔·E

DALL·E is a AI system that can create realistic images and art from a description in natural language. We currently support the ability, given a prompt, to create a new image with a certain size, edit an existing image, or create variations of a user provided image.
DALL·E是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术。我们目前支持根据提示创建具有特定尺寸的新图像、编辑现有图像或创建用户提供的图像的变体的功能。

The current DALL·E model available through our API is the 2nd iteration of DALL·E with more realistic, accurate, and 4x greater resolution images than the original model. You can try it through the our Labs interface or via the API.
通过我们的 API 提供的当前 DALL·E 模型是 DALL·E 的第二次迭代,具有比原始模型更真实、更准确且分辨率高 4 倍的图像。您可以通过我们的实验室界面或 API 进行尝试。

Whisper 耳语

Whisper is a general-purpose speech recognition model. It is trained on a large dataset of diverse audio and is also a multi-task model that can perform multilingual speech recognition as well as speech translation and language identification. The Whisper v2-large model is currently available through our API with the whisper-1 model name.
Whisper 是一种通用语音识别模型。它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过我们的 API 使用 whisper-1 模型名称获取。

Currently, there is no difference between the open source version of Whisper and the version available through our API. However, through our API, we offer an optimized inference process which makes running Whisper through our API much faster than doing it through other means. For more technical details on Whisper, you can read the paper.
目前,Whisper 的开源版本和通过我们的 API 提供的版本没有区别。然而,通过我们的 API,我们提供了优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以阅读该论文。

Embeddings 嵌入

Embeddings are a numerical representation of text that can be used to measure the relatedness between two pieces of text. Our second generation embedding model, text-embedding-ada-002 is a designed to replace the previous 16 first-generation embedding models at a fraction of the cost. Embeddings are useful for search, clustering, recommendations, anomaly detection, and classification tasks. You can read more about our latest embedding model in the announcement blog post.
嵌入是文本的数字表示,可用于衡量两段文本之间的相关性。我们的第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。


Moderation 适度

The Moderation models are designed to check whether content complies with OpenAI's usage policies. The models provide classification capabilities that look for content in the following categories: hate, hate/threatening, self-harm, sexual, sexual/minors, violence, and violence/graphic. You can find out more in our moderation guide.
审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供分类功能,可查找以下类别的内容:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图形。您可以在我们的审核指南中了解更多信息。

Moderation models take in an arbitrary sized input that is automatically broken up to fix the models specific context window.
审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。

MODEL 模型DESCRIPTION 描述
text-moderation-latest 文本审核最新Most capable moderation model. Accuracy will be slighlty higher than the stable model. 最有能力的审核模型。准确度将比稳定模型略高。
text-moderation-stable 文本审核稳定Almost as capable as the latest model, but slightly older. 几乎与最新型号一样功能,但稍旧。

GPT-3 Legacy GPT-3 旧版

GPT-3 models can understand and generate natural language. These models were superceded by the more powerful GPT-3.5 generation models. However, the original GPT-3 base models (davincicurieada, and babbage) are current the only models that are available to fine-tune.
GPT-3模型可以理解并生成自然语言。这些型号被更强大的 GPT-3.5 代型号所取代。然而,原始的 GPT-3 基本模型( davinci 、 curie 、 ada 和 babbage )是当前唯一的模型可以进行微调。

LATEST MODEL 最新款DESCRIPTION 描述MAX TOKENS 最大代币数TRAINING DATA 训练数据
text-curie-001 文本-​​居里-001Very capable, faster and lower cost than Davinci. 比达芬奇能力更强、速度更快、成本更低。2,049 tokens 2,049 个代币Up to Oct 2019 截至 2019 年 10 月
text-babbage-001 文本-​​babbage-001Capable of straightforward tasks, very fast, and lower cost. 能够完成简单的任务、速度非常快且成本较低。2,049 tokens 2,049 个代币Up to Oct 2019 截至 2019 年 10 月
text-ada-001 文本-​​ada-001Capable of very simple tasks, usually the fastest model in the GPT-3 series, and lowest cost. 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,并且成本最低。2,049 tokens 2,049 个代币Up to Oct 2019 截至 2019 年 10 月
davinci 达芬奇Most capable GPT-3 model. Can do any task the other models can do, often with higher quality. 最有能力的 GPT-3 模型。可以完成其他模型可以完成的任何任务,而且质量通常更高。2,049 tokens 2,049 个代币Up to Oct 2019 截至 2019 年 10 月
curie 居里Very capable, but faster and lower cost than Davinci. 非常有能力,但比达芬奇更快、成本更低。2,049 tokens 2,049 个代币Up to Oct 2019 截至 2019 年 10 月
babbage 巴贝奇Capable of straightforward tasks, very fast, and lower cost. 能够完成简单的任务、速度非常快且成本较低。2,049 tokens 2,049 个代币Up to Oct 2019 截至 2019 年 10 月
adaCapable of very simple tasks, usually the fastest model in the GPT-3 series, and lowest cost. 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,并且成本最低。2,049 tokens 2,049 个代币Up to Oct 2019 截至 2019 年 10 月

How we use your data 我们如何使用您的数据

Your data is your data.
你的数据就是你的数据。

As of March 1, 2023, data sent to the OpenAI API will not be used to train or improve OpenAI models (unless you explicitly opt in). One advantage to opting in is that the models may get better at your use case over time.
自 2023 年 3 月 1 日起,发送到 OpenAI API 的数据将不会用于训练或改进 OpenAI 模型(除非您明确选择加入)。选择加入的好处之一是,随着时间的推移,模​​型可能会越来越适合您的用例。

To help identify abuse, API data may be retained for up to 30 days, after which it will be deleted (unless otherwise required by law). For trusted customers with sensitive applications, zero data retention may be available. With zero data retention, request and response bodies are not persisted to any logging mechanism and exist only in memory in order to serve the request.
为了帮助识别滥用行为,API 数据最多可保留 30 天,之后将被删除(除非法律另有要求)。对于拥有敏感应用程序的值得信赖的客户,零数据保留可能是可用的。在零数据保留的情况下,请求和响应主体不会持久保存到任何日志记录机制中,并且仅存在于内存中以便为请求提供服务。

Note that this data policy does not apply to OpenAI's non-API consumer services like ChatGPT or DALL·E Labs.
请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,例如 ChatGPT 或 DALL·E Labs。

Default usage policies by endpoint 按端点的默认使用策略

ENDPOINT 端点DATA USED FOR TRAINING 用于训练的数据DEFAULT RETENTION 默认保留ELIGIBLE FOR ZERO RETENTION 有资格获得零保留
/v1/completions /v1/完成次数No30 days 30天Yes
/v1/chat/completions /v1/聊天/完成No30 days 30天Yes
/v1/edits /v1/编辑No30 days 30天Yes
/v1/images/generations /v1/图像/世代No30 days 30天No
/v1/images/edits /v1/图像/编辑No30 days 30天No
/v1/images/variations /v1/图像/变体No30 days 30天No
/v1/embeddings /v1/嵌入No30 days 30天Yes
/v1/audio/transcriptions /v1/音频/转录NoZero data retention 零数据保留-
/v1/audio/translations /v1/音频/翻译NoZero data retention 零数据保留-
/v1/files /v1/文件NoUntil deleted by customer 直至被客户删除No
/v1/fine-tunes /v1/微调NoUntil deleted by customer 直至被客户删除No
/v1/moderations /v1/节制NoZero data retention 零数据保留-

For details, see our API data usage policies. To learn more about zero retention, get in touch with our sales team.
有关详细信息,请参阅我们的 API 数据使用政策。要了解有关零保留的更多信息,请联系我们的销售团队。

Model endpoint compatibility 模型端点兼容性

ENDPOINT 端点MODEL NAME 型号名称
/v1/chat/completions /v1/聊天/完成gpt-4, gpt-4-0613, gpt-4-32k, gpt-4-32k-0613, gpt-3.5-turbo, gpt-3.5-turbo-0613, gpt-3.5-turbo-16k, gpt-3.5-turbo-16k-0613 gpt-4、gpt-4-0613、gpt-4-32k、gpt-4-32k-0613、gpt-3.5-turbo、gpt-3.5-turbo-0613、gpt-3.5-turbo-16k、gpt-3.5-涡轮-16k-0613
/v1/completions (Legacy) /v1/完成(旧版)text-davinci-003, text-davinci-002, text-davinci-001, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada 文本-​​达芬奇-003,文本-达芬奇-002,文本-达芬奇-001,文本-居里-001,文本-巴贝奇-001,文本-ada-001,达芬奇,居里,巴贝奇,ada
/v1/audio/transcriptions /v1/音频/转录whisper-1 耳语-1
/v1/audio/translations /v1/音频/翻译whisper-1 耳语-1
/v1/fine-tunes /v1/微调davinci, curie, babbage, ada 达芬奇、居里、巴贝奇、艾达
/v1/embeddings /v1/嵌入text-embedding-ada-002, text-similarity--001, text-search---001, code-search---001 文本嵌入-ada-002、文本相似度--001、文本搜索---001、代码搜索---001
/v1/moderations /v1/节制text-moderation-stable, text-moderation-latest 文本审核稳定、文本审核最新

This list does not include all of our first-generation embedding models nor our DALL·E model.
此列表不包括我们所有的第一代嵌入模型,也不包括我们的 DALL·E 模型。