这项高级语音功能,大家可是等了好久。
谷歌又被 OpenAI 截胡了。
前脚谷歌刚刚升级完两款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,后脚奥特曼就直接宣布 GPT-4o 今天起正式开放。
「高级语音功能今天推出!(将在本周内完成),希望您的等待值得。」奥特曼表示道,最后还不忘加一个委屈、小桃心的表情。
这次,OpenAI 的高级语音功能将向所有的 Plus 和 Team 用户推出。但免费用户是体验不了了,因为 OpenAI 暂时没有这个计划。
据了解,Plus 用户每月需支付 20 美元,Team 用户每月支付 30 美元并拥有更多的使用次数。OpenAI 将逐步向用户推出访问权限,并从下周开始面向企业和教育推出。所有 Plus 用户将在秋末之前获得访问权限。
如果你是 Plus 或 Team 用户,当访问高级语音功能时,会在应用程序中看到如下通知。
此次推出的高级语音功能还新增了自定义指令、记忆、五种新声音和改进的口音。它还可以用 50 多种语言说「抱歉我迟到了」。
在下面展示的视频中, 用户和模型在流畅的对话,你可以随时打断聊天内容,彷佛和你聊天的不是机器,而是一个真人。这段 Demo 中的对话内容也特别有意思, GPT-4o 用一口流利的中文说「奶奶对不起,我迟到了,我不是故意让您等这么久的……」,仿佛是 OpenAI 在和用户们道歉,要知道,GPT-4o 可是迟到了将近半年的时间才正式推出。
不过,新功能尚未在欧盟、英国、瑞士、冰岛、挪威或列支敦士登推出。
还在休假的 Greg Brockman 也帮忙宣传了一波:「高级语音的推出,让你可以和 ChatGPT 开启流畅的对话,让你意识到在电脑上打字是多么的不自然。」
除了上新高级语音模式,近日,OpenAI 还发布了一个多语言大规模多任务语言理解 (Multilingual Massive Multitask Language Understanding,MMMLU)数据集,测试集提供了 14 种语言,包括阿拉伯语,德语,西班牙语等,涵盖 57 个不同类别的主题,包括初级知识、法律、物理、历史和计算机科学等高级专业学科。
数据集地址:x.com/_philschmid…