为您的应用定制GPT-3

470 阅读6分钟

开发人员现在可以在他们自己的数据上对GPT-3进行微调,创建一个适合他们应用的定制版本。定制使GPT-3在更广泛的使用情况下变得可靠,并使模型的运行更加便宜和快速。

你可以使用几乎任何形状和大小的现有数据集,或根据用户反馈逐步增加数据。通过微调,一个API客户能够将正确输出率从83%提高到95%。通过每周添加他们产品的新数据,另一个客户将错误率降低了50%。

要开始工作,只需在OpenAI命令行工具中用你提供的文件运行一个命令。你的自定义版本将开始训练,然后在我们的API中立即可用。

阅读文件


去年,我们训练了GPT-3并在我们的API中提供了它。只需几个例子,GPT-3就可以执行各种各样的自然语言任务,这个概念被称为几率学习或提示设计。定制GPT-3可以产生更好的结果,因为你可以提供比提示设计所能提供的更多的例子。

您可以通过一个命令为您的应用定制GPT-3,并立即在我们的API中使用。

openai api fine_tunes.create -t <train_file>

查看如何

只需要不到100个例子就可以开始看到微调GPT-3的好处,而且随着你添加更多的数据,性能会继续提高。在去年6月发表的研究报告中,我们展示了用不到100个例子进行微调是如何提高GPT-3在某些任务上的性能。我们还发现,例子的数量每增加一倍,质量就会有线性提高。

对于我们最具挑战性的研究数据集之一,即小学数学问题,对GPT-3进行微调后,准确率比及时设计的情况下提高了2到4倍。

两种规模的GPT-3模型,Curie和Davinci,在我们最具挑战性的研究数据集之一的8000个例子中进行了微调,即小学数学问题。我们比较了模型在创建10个完成度时的解题能力。

定制GPT-3提高了输出的可靠性,提供了更一致的结果,您可以在生产用例中信赖。一位客户发现,定制GPT-3后,不可靠输出的频率从17%下降到5%。由于GPT-3的定制版本是为您的应用量身定做的,所以提示可以更短,降低成本并改善延迟。

无论是文本生成、总结、分类,还是GPT-3能够执行的任何其他自然语言任务,定制GPT-3将提高性能。

由GPT-3的定制版本支持的应用程序

Keeper Tax帮助独立承包商和自由职业者处理他们的税务。在客户链接他们的财务账户后,Keeper Tax使用各种模型来提取文本并对交易进行分类。使用分类数据,Keeper Tax可以识别容易遗漏的税务核销,并帮助客户直接从应用程序中报税。通过定制GPT-3,Keeper Tax能够不断改善结果。每周一次,Keeper Tax增加了大约500个新的训练实例来微调他们的模型,这使得每周的准确率提高了约1%,准确率从85%提高到93%。

Viable帮助公司从客户的反馈中获得洞察力。通过定制GPT-3,Viable能够将大量的非结构化数据转化为可读的自然语言报告,突出顶级的客户投诉、赞美、请求和问题。定制GPT-3提高了Viable的报告的可靠性。通过使用定制版的GPT-3,总结客户反馈的准确性从66%提高到90%。结果是有形的、直观的信息,客户需要这些信息来指导他们的产品决策。

Sana实验室是人工智能开发和应用于学习领域的全球领导者。Sana学习平台通过利用最新的ML突破为每个人定制内容,为企业提供个性化的学习体验。通过用他们的数据定制GPT-3,Sana的问题和内容生成从语法上正确但一般的回答变成了高度准确的输出。这产生了60%的改进,从根本上为他们的学习者提供了更加个性化和有效的体验。

Elicit是一个人工智能研究助理,它帮助人们利用学术论文的发现直接回答研究问题。该工具从庞大的研究论文语料库中找到最相关的摘要,然后应用定制版的GPT-3来生成该论文对该问题的主张(如果有的话)。定制版的GPT-3在三个重要的衡量标准上优于提示设计:结果更容易理解(提高了24%),更准确(提高了17%),以及总体上更好(提高了33%)。

所有API客户今天就可以定制GPT-3。注册并开始使用微调文档

如何为您的应用定制GPT-3


设置

  • 从你的终端安装基于python的openai客户端。pip install --upgrade openai
  • 你的API密钥设置为环境变量:export OPENAI_API_KEY=<api_key>

训练一个自定义模型

  • 在演示数据集上微调Ada模型,将帮助信息从西班牙语翻译成英语。

    openai api fine_tunes.create -m ada --n_epochs 2 /t cdn.openai.com/API/train-d…


    (Ctrl-C会中断数据流,但不会取消微调)

    [2021-12-08 12:11:30] 创建微调:ft-gK9R3N3lDQYQJD0SXqlF8Fnc

    [2021-12-08 12:11:40] 微调费用为0.01美元。

    [2021-12-08 12:11:40] Fin-tune已排队。队列号:0

    [2021-12-08 12:11:45] 微调开始。

    [2021-12-08 12:12:58] 完成历时1/2

    [2021-12-08 12:13:56] 完成纪元2/2

    [2021-12-08 12:14:26] 上传了模型:ada:ft-org-2021-12-08-20-14-25

    [2021-12-08 12:14:29] 上传的结果文件:file-QvY81nzrOhXMenjMS5OlPeBW

    [2021-12-08 12:14:30] 微调成功

    工作完成!状态:已成功 🎉

    试用你的微调模型。

    openai api completions.create -m ada:ft-org-2021-12-08-20-14-25 -p <YOUR_PROMPT>。

使用自定义模型

  • 要求你的定制模型进行翻译。

    openai api completions.create -m <model_ID> --max-tokens 30 --temperature 0 --stop "##" -p $'Conecte la PS3 y vaya a Configuración>Configuraciones de Red, selectccione la red and escriba sus credenciales./nEnglish translation:'


    连接PS3并进入 "配置">"红色配置",选择 "红色 "并写下 "信用"。连接PS3并进入设置>账户设置,选择网络并写下你的凭证。

document.documentElement.classList.add("scroll-behavior-smooth"); setTimeout(function () { var elts = document.querySelectorAll('.js-to-straight-quotes'); elts.forEach(function (elt) { elt.innerHTML = elt.innerHTML.replace("' ", "' ") .replace("' "); }, 500) 。