GPT-4o已发布,你怎么看?
- GPT-4o 是 ChatGPT 免费用户的重大升级,可让他们使用以前为付费用户保留的功能。
- GPT-4o 经过重建和重新训练,可以理解语音转语音和其他形式的输入和输出,而无需将其转换为文本。
- 所有 ChatGPT 用户都可以通过手机、台式机和网络逐步使用 GPT-4o。
- GPT-4o 与 Google Gemini Live 竞争,提供语音和视频助理功能。
- GPT-4o 在实时语音和视频分析方面优于 GPT-4,而且会话性更强。
速览
当地时间2024年5月13日,OpenAI 首席技术官Mira Murati宣布活动开始,并讨论了如何使产品 "无论您身在何处 "都更易于使用。这包括一个具有全新用户界面的桌面应用程序,目前只发布了Mac版本。同时还推出了一种名为 GPT-4o 的新模式,为包括免费版 ChatGPT 用户在内的所有用户带来 GPT-4 级别的智能。这些将在未来几周内陆续推出。
OpenAI 正在开放许多以前只对付费用户开放的功能。这包括访问图像和文档分析、数据分析和自定义 GPT 聊天机器人,也就是GPT-o。GPT-4o 采用多模态设计,由 OpenAI 从零开始重建和重新训练,可以理解语音转语音以及其他形式的输入和输出,而无需首先将其转换为文本。如果您是 Plus 用户,您已经可以访问 GPT-4o,在未来几周内,所有 ChatGPT 用户都可以通过手机、桌面和网络逐步访问 GPT-4o。虽然 GPT-4o 可能是一种全新的人工智能模型,但它在标准文本任务上的表现实际上并没有超过 GPT-4。不过,它在实时语音和视频分析方面会更胜一筹。它的对话能力也更强。同时,GPT-4o 具有一些令人印象深刻的新特性和功能,这是以前无法实现的。其中包括会话语音和多语言实时翻译,但这些功能尚未上线。
OpenAI 演示了 GPT-4o 的一项功能--实时语音翻译,它可能会改变全球旅游业的游戏规则。在演示中ChatGPT 的工作方式堪比全球峰会上的人工翻译。在演示过程中,OpenAI 首席技术官Mira Murati用意大利语发言,ChatGPT 用英语重复她说的话,并转述给她的同事Mark。然后,他用英语发言,ChatGPT 将其翻译成意大利语,并将带着可疑口音的话语回传给Mira Murati。
新版 ChatGPT 的功能之一是原生视觉功能。这主要是指它能通过手机摄像头 "看 "到你。 在一次演示中,团队向 ChatGPT 展示了他们刚写在纸上的一个方程式,并要求人工智能帮助解决问题。人工智能并没有给出答案,而是提供了建议,并一步一步地指导他们。人工智能能够看到你所做的改动。在另一个例子中,他们打开摄像头,让人工智能看到纸上的字母 "I heart ChatGPT"。人工智能在听到 "我爱你 "时显得非常激动。最后有一个奇怪的时刻,摄像头仍然处于激活状态,ChatGPT 看到主持人穿的衣服后说:"哇,我喜欢你穿的这身衣服"。
GPT-4o 最大的升级之一是实时语音。该机型能够端对端地进行语音转语音处理。可以直接监听音频,而不是先转录语音,稍后再处理。在这一功能的演示中,OpenAI 的工作人员对着语音助手做了粗重的呼吸,而语音助手能够提供改善呼吸技巧的建议。GPT-4o甚至警告他 "你不是吸尘器"。你也不必等它说完,可以直接实时打断,GPT-4o甚至还能捕捉情绪。
随着免费版 ChatGPT 的重大升级以及之前 ChatGPT Plus 独享的所有重要功能,人们不禁要问是否值得每月支付 20 美元。OpenAI 首席技术官米Mira Murati说,付费用户最大的好处是每天向 GPT-4o 提出的请求将是免费计划的五倍。OpenAI官网表示免费层用户将默认使用 GPT-4o,但使用 GPT-4o 发送信息的数量有限制,具体数量将根据当前使用情况和需求而定。不可用时,免费层用户将切换回 GPT-3.5。ChatGPT Plus 和 Team 用户可以访问 chatgpt.com 上的 GPT-4 和 GPT-4o,但使用上限更高。ChatGPT Plus 和 Team 用户可以从页面顶部的下拉菜单中选择 GPT-4o。自 2024 年 5 月 13 日起,Plus 用户在 GPT-4o 上每 3 小时最多可发送 80 条信息,在 GPT-4 上每 3 小时最多可发送 40 条信息。我们可能会在高峰时段降低限制,以保证 GPT-4 和 GPT-4o 可供最广泛的用户使用。ChatGPT Team 工作区用户的 GPT-4 和 GPT-4o 消息上限高于 ChatGPT Plus。请注意,未使用的消息不会累积(例如,如果您等待了 6 小时,那么在 GPT-4 上接下来的 3 小时内您将不会有 80 条消息可供使用)。关于如何获取ChatGPT账号或升级4.0服务可参考这里
GPT-4o 正在改变人机互动的协作模式。"首席技术官Mira Murati说:"当我们彼此互动时,有很多事情我们认为是理所当然的。GPT-4o 能够跨语音、文本和视觉进行推理。"这让我们能够为免费用户带来 GPT-4 级的智能。他们已经为此努力了好几个月。超过一亿人经常使用 ChatGPT,而 4o 比以前版本的 GPT-4 要高效得多。这意味着他们可以将 GPT(自定义聊天机器人)引入免费版 ChatGPT。您还可以使用数据、代码和视觉工具--让您无需付费就能分析图像。"