OpenAI DevDay, Opening Keynote 总结

256 阅读3分钟

视频地址:<www.youtube.com/watch?v=U9m…

回顾

2022.11.30:发布了ChatGPT 。

2023.3:推出了 GPT-4。

在过去的几个月里,推出了语音和视觉功能,以便 ChatGPT 现在可以看到、听到和说话。

最近:

  • 推出了最先进的图像模型 DALL-E3。
  • 对于企业客户,推出了 ChatGPT Enterprise。提供企业级安全和隐私、更高速的 GPT-4 访问,更长的上下文窗口等等。

1699844230902.jpg

如今:

  • 有大约 200w 开发人员在 OpenAI API 上构建各种用例。
  • 超过 92% 的财富 500 强公司都使用 OpenAI 的产品。
  • ChatGPT 目前每周约有 1 亿的活跃用户。

WechatIMG1506.jpg

OpenAI 是目前全球最先进、应用最广泛的人工智能平台。

WechatIMG1507.jpg

新的东西

GPT-4 Turbo

1699865211030.jpg

Context length(上下文长度)

支持多达 128000 个上下文标记。除了更长的上下文长度之外,在较长的上下文中更加准确。

More control(更多的控制)

对模型的响应和输出有更多的控制。

有一个新功能,叫 JSON 模式。确保模型将使用有效的 JSON 进行响应,将使调用 API 变得更加容易。在函数调用方面也更加出色,可以一次调用多个函数。

引入了一项可重现输出的新功能。可以传递一个场景参数,将使模型返回一致的输出。可以更好的控制模型行为。 发布会当天推出测试版。

在接下来的几周内,推出一项功能,可以在 API 中查看日志问题。

Better knowledge(更好的知识)

在平台上启动检索,可以将外部文档或数据库中的知识代入正在构建的任何容器中。

拥有截至 2023.4 的知识,随着时间的推移,将继续改进这一点。

New modalities(新模式)

DALL-E3、GPT-4 Turbo with vision、新的文本转语音模型都将进入 API。

GPT-4 Turbo 现在可以通过 API 接受图像作为输入。它可以生成标题、分类和分析。

借助新的文本转语音模型,将能够从 API 中的文本生成极其自然的音频,并有六中预设声音可供选择。

发布了开源语音识别模型的下一代版本 Whisper V3,并且很快就会推出 API。具有跨多种语言的改进性能。

Customization(定制)

帮助其他公司制作出色的定制模型,进行额外的特定领域预训练,针对领域量身定制的自定义 RL 训练后流程等等。

Higher rate limits(更高的速率限制)

将能够直接在 API 账户设置中请求更改进一步的速率限制和配额。

Copyright Shield(版权保护)

如果面临有关版权侵权的法律索赔,将加入并为客户辩护并支付所产生的费用。适用于 ChatGPT Enterprise 和 API。

从来不使用来自 API 或 ChatGPT Enterprise 的数据进行训练。

GPT-4 Turbo Pricing

openai.com/pricing

ChatGPT 的一些改进

1699865381219.jpg

image.png

GPTs

GPTs 是 ChatGPT 的定制版本,用于特定目的。你可以建立一个 GPT,通过指示、扩展的知识和行动,然后可以发布以供其他人使用。

GPT 商店

展示最好和最受欢迎的 GPT。

将向那些构建最有用和最常用的 GPT 的人支付 GPT(OpenAI) 收入的一部分。

API

将相同的概念引入 API。

Assistants API

包括持久线程,因为不必弄清楚如何处理长对话历史记录。

内置检索。

代码解释器,沙箱环境中工作的 Python 解释器。

改进的函数调用。