OpenAI DevDay, Opening Keynote 总结视频地址：<https://www.youtube.c

回顾

2022.11.30：发布了ChatGPT 。

2023.3：推出了 GPT-4。

在过去的几个月里，推出了语音和视觉功能，以便 ChatGPT 现在可以看到、听到和说话。

支持多达 128000 个上下文标记。除了更长的上下文长度之外，在较长的上下文中更加准确。

对模型的响应和输出有更多的控制。

有一个新功能，叫 JSON 模式。确保模型将使用有效的 JSON 进行响应，将使调用 API 变得更加容易。在函数调用方面也更加出色，可以一次调用多个函数。

引入了一项可重现输出的新功能。可以传递一个场景参数，将使模型返回一致的输出。可以更好的控制模型行为。发布会当天推出测试版。

在接下来的几周内，推出一项功能，可以在 API 中查看日志问题。

在平台上启动检索，可以将外部文档或数据库中的知识代入正在构建的任何容器中。

拥有截至 2023.4 的知识，随着时间的推移，将继续改进这一点。

DALL-E3、GPT-4 Turbo with vision、新的文本转语音模型都将进入 API。

GPT-4 Turbo 现在可以通过 API 接受图像作为输入。它可以生成标题、分类和分析。

借助新的文本转语音模型，将能够从 API 中的文本生成极其自然的音频，并有六中预设声音可供选择。

发布了开源语音识别模型的下一代版本 Whisper V3，并且很快就会推出 API。具有跨多种语言的改进性能。

帮助其他公司制作出色的定制模型，进行额外的特定领域预训练，针对领域量身定制的自定义 RL 训练后流程等等。

将能够直接在 API 账户设置中请求更改进一步的速率限制和配额。

如果面临有关版权侵权的法律索赔，将加入并为客户辩护并支付所产生的费用。适用于 ChatGPT Enterprise 和 API。

从来不使用来自 API 或 ChatGPT Enterprise 的数据进行训练。

GPTs 是 ChatGPT 的定制版本，用于特定目的。你可以建立一个 GPT，通过指示、扩展的知识和行动，然后可以发布以供其他人使用。

展示最好和最受欢迎的 GPT。

将向那些构建最有用和最常用的 GPT 的人支付 GPT（OpenAI）收入的一部分。

将相同的概念引入 API。

包括持久线程，因为不必弄清楚如何处理长对话历史记录。

内置检索。

代码解释器，沙箱环境中工作的 Python 解释器。

改进的函数调用。