OpenAI官方指南:企业落地AI的七大经验

212 阅读20分钟

最近,OpenAI发布了人工智能企业落地的七条经验,是OpenAI在服务客户中的经验总结。作为全球人工智能的领导者、风向标,它们的经验对我们人工智能的落地有重要的参考意义。

image.png 以下是原文翻译:

一种新的工作方式

作为一家人工智能研究和部署公司,OpenAI优先与全球公司合作,因为我们的模型将越来越多地在复杂、复杂的互联系统中发挥最佳作用。

我们看到人工智能在三个方面带来了显著的、可衡量的改进:

01 员工绩效。帮助人们在更短的时间内交付更高质量的输出。

02 自动化常规操作。让人们从重复的任务中解放出来,以便他们可以专注于增加价值。

03 为产品提供动力。通过提供更相关、更响应的客户体验。

但是,利用人工智能并不等同于开发软件或部署云应用。最成功的公司往往是那些将其视为一种新范式的企业。这导致了实验性思维和迭代方法,从而更快地获得价值,并获得用户和利益相关者的更大支持。

我们的方法:迭代开发

OpenAI由三个团队组成。我们的研究团队推进人工智能的基础,开发新的模型和能力。我们的应用团队将这些模型转化为产品,比如ChatGPT企业版和我们的API。而我们的部署团队则将这些产品带入公司,解决它们最紧迫的用例。

我们使用迭代部署,快速从客户用例中学习,并利用这些信息加速产品改进。这意味着定期发布更新,获取反馈,并在每一步改进性能和安全性。

其结果是:用户可以尽早、经常地访问人工智能的新进展,而你的反馈将塑造未来的产品和模型。

企业采用人工智能的七个经验

01 从评估开始。使用系统化的评估流程来衡量模型在使用案例中的表现。

02 在产品中嵌入AI。创造新的客户体验和更多相关的互动。

03 立即开始,尽早投资。你越早开始,价值就越复利。

04 自定义和调整您的模型。根据您的用例调优AI,可以显著增加价值。

05 让专家掌握人工智能。最接近一个流程的人,最适合用人工智能来改进它。

06 解除对开发者的屏蔽。自动化软件开发生命周期可以成倍增加人工智能红利。

07 设置大胆的自动化目标。大多数流程都包含大量的死记硬背工作,非常适合自动化。目标要高。

让我们通过客户故事来深入探讨每一个问题。

01-从评估开始

摩根士丹利如何确保质量和安全

作为全球金融服务领域的领导者,摩根士丹利是一家关系型企业。不出所料,整个公司都对人工智能如何为高度个人化和敏感的工作增添价值提出了疑问。

解决办法是针对每个提议的应用程序进行密集评估。评估就是一种严格的、结构化的流程,用于衡量AI模型在特定用例中实际表现如何。它也是持续改进人工智能支持的流程的一种方式,在每一步都有专家反馈。

它是如何开始的

摩根士丹利的第一次评估的重点是提高财务顾问的效率和效果。其基本原理很简单:如果顾问能够更快地获取信息,并减少重复性任务所花费的时间,他们就能向客户提供更多更好的见解。

他们从三个模型评估开始:

01 语言翻译。衡量模型生成翻译的准确性和质量。

02 摘要。使用公认的准确性、相关性和连贯性指标来评估模型如何浓缩信息。

03 人类培训师。将人工智能的结果与专家顾问的反应进行比较,对准确性和相关性进行评分。

这些评估和其他评估让摩根士丹利有信心开始将用例投入生产。

进展如何

如今,98%的摩根士丹利顾问每天都在使用OpenAI;获取文件的机会从20%跃升至80%,搜索时间大幅减少;由于任务自动化和更快的洞察力,顾问们花在客户关系上的时间也更多。

image.png

定义的评估

评估是验证和测试模型生成输出的过程。严格的评估可以带来更稳定、可靠的应用程序,使其具有更强的适应变化能力。评估围绕着衡量模型输出质量的任务构建——与基准相比,它是否更准确?更合规?更安全?关键指标将取决于每个用例中最重要的是什么。

02-将AI嵌入产品中

如何真正实现工作匹配的人性化

当人工智能被用于自动化和加速繁琐、重复的工作时,员工就可以专注于只有人类才能做的事情。而且,由于人工智能可以处理来自多个来源的海量数据,它能够创造更人性化、更相关、更个性化的客户体验。

事实上,世界No.1求职网站使用GPT-4o mini,以新的方式将求职者与工作匹配。

为什么的力量

向求职者推荐好工作只是Indeed体验的开始。他们还需要向候选人解释为什么推荐这个特定的工作给他们。

实际上,它利用GPT-4o mini的数据分析和自然语言能力,在给求职者的邮件和信息中塑造这些“为什么”的陈述。通过使用人工智能,流行的“邀请申请”功能还会解释为什么候选人的背景或以往的工作经验使这份工作很适合他。

Indeed团队将之前的职位匹配引擎与GPT驱动的版本进行了测试,使用了新的定制上下文。性能提升显著:

开始申请工作的人数增加了20%。

下游成功率提高了13%,不仅更多的候选人可能会申请,而且雇主也更有可能雇佣他们。

Indeed每月向求职者发送超过2000万条信息,每月有3.5亿访问者访问该网站,这些增长带来了显著的商业影响。

但扩大规模也意味着使用更多的代币。为了提高效率,OpenAI和Indeed合作调整了一个更小的GPT模型,该模型能够以60%或更少的token提供类似的结果。

帮助求职者找到合适的工作,以及理解为什么某个机会适合他们,是人类的深刻结果。Indeed团队利用人工智能帮助更多的人更快地找到工作——这是每个人的胜利。

image.png

03-立即开始,尽早投资

Klarna如何从人工智能知识的积累中获益

人工智能很少是即插即用的解决方案——通过迭代,用例会变得越来越复杂和重要。您越早开始,您的组织就越能从不断改进中获益。

全球支付网络和购物平台Klarna推出了一款新的AI助手,以简化客户服务。几个月内,这款助手处理了所有服务聊天的三分之二——相当于数百名客服人员的工作量,将平均解决时间从11分钟缩短到仅2分钟。该计划预计可带来4000万美元的利润提升,同时保持与人工支持相当的客户满意度。这些成果并非一蹴而就。Klarna通过不断测试和优化助手实现了这一业绩。

同样重要的是,Klarna 90%的员工现在在日常工作中使用人工智能。全公司对人工智能的熟悉度不断提高,使Klarna能够更快地行动,更高效地启动内部项目,并不断优化客户体验。通过早期投资并鼓励广泛采用,Klarna看到了人工智能带来的好处不断累积——推动了其业务的回报。

image.png

04-自定义和微调你的模型

洛氏如何改善产品搜索

从采用人工智能中获得最大成功的公司,往往是那些投入时间和资源,定制和训练自己的人工智能模型的公司。OpenAI在我们的API上投入了大量资金,使其更容易定制和微调模型——无论是作为自助服务方式,还是使用我们的工具和支持。

我们与财富50强家居装修公司Lowe‘s紧密合作,以提高其电子商务搜索功能的准确性和相关性。由于有数千家供应商,Lowe’s经常不得不处理不完整或不一致的产品数据。

关键在于准确的产品描述和标签。但这也需要了解消费者如何搜索,而这种动态变化会随着产品类别不同而变化。这就是微调的用武之地。

通过微调OpenAI模型,Lowe的团队能够将产品标签准确性提高20%,错误检测提高60%。

image.png

什么是微调?

如果GPT模型是一套现成的西装,那么微调就是量身定制的选择——即根据组织的具体数据和需求定制模型。

为什么它很重要:

改进的准确性。通过针对您的独特数据进行训练,例如产品目录或内部常见问题解答,该模型可提供更相关、更符合品牌的结果。

领域专长。微调后的模型能更好地理解你所在行业的术语、风格和上下文。

一致的语气和风格。对于零售商来说,这意味着每个产品描述都符合品牌的声音;对于律师事务所来说,这意味着每次都要正确格式化的引用。

更快的成果。更少的手动编辑或重新检查意味着您的团队可以专注于高价值的任务。

05-让专家掌握人工智能

BBVA采用专家主导的人工智能方法

您的员工最了解您的流程和问题,通常也是找到人工智能驱动解决方案的最佳人选。将人工智能交给这些专家,可能比尝试构建通用或横向解决方案更强大。

全球银行业领导者BBVA拥有超过125,000名员工,每位员工都面临着独特的挑战和机遇。他们决定将人工智能引入员工手中,与法律、合规和IT安全部门紧密合作,确保负责任地使用。他们首先在全球范围内推出了ChatGPT企业版,然后让人们自行探索自己的应用场景。

BBVA全球人工智能应用负责人Elena Alfaro表示:“通常情况下,像我们这样的企业,即便是构建一个原型也需要技术资源和时间。有了定制的GPT,任何人都可以创建应用程序来解决独特的问题——开始起来非常容易。”

在五个月的时间里,BBVA员工创建了超过2900个自定义GPT——其中一些将项目和流程时间从几周缩短到几小时。这种影响遍及许多学科和部门:

信贷风险团队。使用ChatGPT更快、更准确地确定信用。

法律团队。它每年回答4万个关于政策、合规等问题。

客户服务团队。自动执行NPS调查的情感分析。

这些胜利继续在营销、风险管理、运营等领域蔓延开来,这一切都归功于他们将人工智能交到了那些知道如何将其应用到自己领域的人手中。

image.png

产品说明:经过深入研究,ChatGPT可以独立完成工作。只需给出一个提示,它就能整合数百个在线资源,生成全面且达到博士水平的报告。这不仅提高了员工的工作效率,还让他们能够在几分钟内获得任何主题的深入详细研究。在跨领域的专家内部评估中,深度研究平均为每个复杂任务节省了4小时。

06-释放开发者潜能

Mercado Libre构建AI程序的速度更快,更稳定

开发人员资源是许多组织的主要瓶颈和增长抑制因素。当工程团队不堪重负时,它会减缓创新,并产生无法克服的应用程序和想法积压。

拉丁美洲最大的电商和金融科技公司Mercado Libre与OpenAI合作,构建了一个开发平台层来解决这一问题。这个平台名为Verdi,由GPT-4o和GPT-4o mini驱动。如今,它帮助17,000名开发者统一并加速他们的AI应用开发。

Verdi将语言模型、Python节点和API集成在一起,创建了一个可扩展且一致的平台,使用自然语言作为中心界面。开发人员现在可以构建一致的高质量应用,速度更快,无需进入源代码。安全、护栏和路由逻辑都已内置。

因此,人工智能应用开发速度显著加快,帮助Mercado Libre员工做了一些了不起的事情,包括:

提高库存能力。GPT-4o mini Vision标签和完成产品列表,允许Mercado目录100倍更多的产品。

检测欺诈。每天评估数百万个产品列表的数据,将标记项目的欺诈检测准确率提高到近99%。

自定义产品描述。翻译产品标题和描述,以适应微妙的西班牙语和葡萄牙语方言。

增加订单。自动审查摘要,以帮助用户快速掌握产品反馈。

个性化通知。定制推送通知,以提高用户粘性和改善产品推荐。

image.png

07-设置大胆的自动化目标

我们如何在OpenAI自动化自己的工作

在OpenAI,我们每天都在与人工智能打交道,所以我们经常发现自动化自己工作的新方法。

例如:我们的支持团队陷入了困境,花费时间访问系统,试图理解上下文,编写响应,并为客户采取正确的行动。

因此,我们建立了一个内部自动化平台。它在我们现有的工作流程和系统之上运行,以自动化例行工作并加速洞察和行动。

我们的第一个用例:在Gmail上工作,以制定客户响应并触发行动。使用我们的自动化平台,我们的团队可以立即访问客户数据和相关知识文章,然后将结果纳入响应邮件或特定行动——例如更新帐户或打开支持票。

通过将人工智能嵌入到现有工作流程中,我们的团队更加高效、响应迅速且以客户为中心。该平台每月处理数十万项任务,让人们可以做更多高影响力的工作。不出所料,该系统现在正在其他部门推广。

这是因为我们从一开始就设定了大胆的自动化目标,而不是接受低效的流程作为业务成本。

Conclusion

相互学习

正如前面的例子所示,每个企业都充满了利用人工智能的力量来改善结果的机会。用例可能因公司和行业而异,但这些经验教训适用于所有市场。

共同的主题是:人工智能的部署得益于开放、实验性的思维,以及严格的评估和安全防护措施。取得成功的公司并不是急于将人工智能模型注入到每一个工作流程中。它们围绕高回报、低投入的用例进行调整,在迭代过程中不断学习,然后将这些经验应用到新的领域。

结果是明确和可衡量的:更快、更准确的过程;更个性化的客户体验;更有回报的工作,因为员工专注于人们最擅长的事情。

我们现在看到公司正在整合人工智能工作流,以自动化越来越复杂的过程——通常使用工具、资源和其他代理来完成工作。

我们将继续从人工智能的前线进行报道,以帮助引导你自己的思考。

产品说明:Operator

Operator是OpenAI代理方法的一个例子。利用自己的虚拟浏览器,Operator可以像人类一样浏览网页、点击按钮、填写表单和收集数据。

它还可以跨各种工具和系统运行进程,无需自定义集成或API。企业可以使用它来自动化以前需要人工干预的工作流程,例如:

使用操作员与web应用程序进行交互,像真实用户一样自动执行软件测试和QA,并标记任何UI问题。

代表用户更新记录系统,无需技术说明或API连接。

其结果是:端到端自动化,使团队摆脱重复性任务,并提高整个企业的效率。

可信的人工智能企业平台

一目了然的安全性和隐私

对于我们的企业客户来说,没有什么比安全、隐私和控制更重要了。我们如何确保这一点:

您的数据仍属于您。我们不会使用您的内容来训练我们的模型;您的企业保留完全所有权。

企业级法规遵从性。数据在传输和静止时都进行了加密,符合SOC 2 Type 2和CSA STAR Level 1等顶级标准。

粒度访问控制。您可以选择谁可以查看和管理数据,确保内部治理和合规。

灵活的保留。调整日志记录和存储设置,以符合组织策略。

老唐笔记

文章看完了,下面我们做一下总结。文章介绍了OpenAI对于人工智能在企业落地的七条经验,它们分别是:

01 从评估开始。使用系统化的评估流程来衡量模型在使用案例中的表现。

摩根士丹利通过评估各个工作流程采用AI带来的效果,并通过专家反馈。目前,98%的摩根士丹利顾问每天都在使用OpenAI;获取文件的机会从20%跃升至80%,搜索时间大幅减少;由于任务自动化和更快的洞察力,顾问们花在客户关系上的时间也更多。

02 在产品中嵌入AI。创造新的客户体验和更多相关的互动。

向求职者推荐好工作只是Indeed体验的开始。它利用GPT-4o mini的数据分析和自然语言能力,在给求职者的邮件和信息中塑造这些“为什么”的陈述。

开始申请工作的人数增加了20%。

招聘成功率提高了13%,不仅更多的候选人可能会申请,而且雇主也更有可能雇佣他们。

03 立即开始,尽早投资。你越早开始,价值复利越高。

全球支付网络和购物平台Klarna推出了一款新的AI助手,以简化客户服务。几个月内,这款助手处理了所有服务聊天的三分之二——相当于数百名客服人员的工作量,将平均解决时间从11分钟缩短到仅2分钟。该计划预计可带来4000万美元的利润提升,同时保持与人工支持相当的客户满意度。

同样重要的是,Klarna 90%的员工现在在日常工作中使用人工智能。全公司对人工智能的熟悉度不断提高,使Klarna能够更快地行动,更高效地启动内部项目,并不断优化客户体验。通过早期投资并鼓励广泛采用,Klarna看到了人工智能带来的好处不断累积——推动了其业务的回报。

04 自定义和调整您的模型。根据您的用例调优AI,可以显著增加价值。

通过微调OpenAI模型,财富50强家居装修公司Lowe的团队能够将产品标签准确性提高20%,错误检测提高60%。

05 让专家掌握人工智能。最接近一个流程的人,最适合用人工智能来改进它。

BBVA全球人工智能应用负责人Elena Alfaro表示:“通常情况下,像我们这样的企业,即便是构建一个原型也需要技术资源和时间。有了定制的GPT,任何人都可以创建应用程序来解决独特的问题——开始起来非常容易。”

在五个月的时间里,BBVA员工创建了超过2900个自定义GPT——其中一些将项目和流程时间从几周缩短到几小时。

06 释放开发者的潜能。软件开发生命周期自动化,可以成倍增加人工智能红利。

拉丁美洲最大的电商和金融科技公司Mercado Libre与OpenAI合作,构建了一个开发平台层来解决这一问题。这个平台名为Verdi,由GPT-4o和GPT-4o mini驱动。如今,它帮助17,000名开发者统一并加速他们的AI应用开发。

Verdi将语言模型、Python节点和API集成在一起,创建了一个可扩展且一致的平台,使用自然语言作为中心界面。开发人员现在可以构建一致的高质量应用,速度更快,无需进入源代码。

07 设置大胆的自动化目标。大多数流程都包含大量的死记硬背工作,非常适合自动化,目标要高。对于重复工作,我们第一个要想到能不能进行自动化。

OpenAI的第一个用例:在Gmail上工作,以制定客户响应并触发行动。使用我们的自动化平台,我们的团队可以立即访问客户数据和相关知识文章,然后将结果纳入响应邮件或特定行动——例如更新帐户或打开支持票。

通过将人工智能嵌入到现有工作流程中,我们的团队更加高效、响应迅速且以客户为中心。该平台每月处理数十万项任务,让人们可以做更多高影响力的工作。不出所料,该系统现在正在其他部门推广。

好了,这就是今天分享的人工智能在企业落地的七大经验,希望对你有启发。