一:事件背景
北京时间本周三凌晨,OpenAI 首席产品官凯文・威尔(Kevin Weil)通过 X 平台确认,高级语音模式(Advanced Voice Mode)在本周全面上线 ChatGPT 网页版,面向付费用户开启。
ChatGPT,作为OpenAI开发的人工智能聊天机器人,凭借其强大的自然语言处理能力和高度的智能化水平,已经赢得了全球用户的广泛赞誉。而此次引入的高级语音模式,更是将ChatGPT的交互体验提升到了一个新的高度。
据悉,高级语音模式依托最新的GPT-4o模型,实现了与用户的实时互动。用户只需在ChatGPT网页版中点击提示窗口右下角的语音图标,并授予浏览器使用麦克风的权限,即可轻松启动该功能。在高级语音模式下,ChatGPT不仅能够用自然语言与用户进行流畅的交流,还能够感知用户的语调和语速等非语言信号,并在回应时模仿情绪,使对话更加生动真实。
此外,高级语音模式还提供了多种不同的声音风格供用户选择。无论是随和的“Arbor”语气,还是自信乐观的“Ember”风格,用户都可以根据自己的喜好进行个性化设置。同时,用户还可以通过设置自定义指令来定制ChatGPT的说话方式,如特定的节奏、发音清晰度、慢速说话等,以满足不同场景下的需求。
值得一提的是,高级语音模式在推出初期将面向ChatGPT Plus、Team、Enterprise和Edu的付费用户开放。虽然Plus和Teams用户每天的语音使用量都有上限,但OpenAI表示,未来该功能也将面向免费用户开放,让更多人享受到AI技术带来的便利。
除了高级语音模式外,OpenAI还在不断优化ChatGPT的其他功能。例如,他们正在探索如何减少语音模式的“打断感”,以提升用户体验。同时,OpenAI还计划将新的搜索体验引入ChatGPT高级语音模式和画布界面(Canvas),进一步丰富产品的功能和应用场景。
总的来说,ChatGPT网页端引入的高级语音模式是一项令人振奋的更新。它不仅提升了用户与AI助手的交互体验,还展示了OpenAI在AI技术领域的创新能力和领先地位。相信随着技术的不断进步和应用的不断拓展,ChatGPT将在未来为我们带来更多惊喜和便利。
二、功能介绍
- 名称:高级语音模式(Advanced Voice Mode)。
- 上线平台:ChatGPT网页版。
- 面向用户:初期面向ChatGPT Plus、Team、Enterprise和Edu的付费用户开放。
- 功能特点:
-
- 原生音频处理能力:高级语音模式依托最新的GPT-4o模型,能够用自然语言与用户进行实时互动。
- 感知非语言信号:能够感知用户的语调和语速等非语言信号,并在回应时模仿情绪,使对话更加生动真实。
- 个性化声音选项:提供了多种不同的声音风格供用户选择,如“Arbor”代表随和的语气,“Ember”则表达自信与乐观。
- 自定义指令:用户可以通过设置自定义指令来定制ChatGPT的说话方式,如特定的节奏、发音清晰度、慢速说话等。
- 多语言支持:ChatGPT可使用50种语言说“对不起,我迟到了”,并能根据谈话的语气调整声音。
三、使用方式
- 启动方式:已订阅付费计划的用户,点击ChatGPT网页版提示窗口右下角的语音图标,即可启动高级语音模式。但前提是需授予浏览器使用麦克风的权限。
- 语音使用量限制:Plus和Teams用户每天的语音使用量都有上限,当达到上限时,系统会发出提醒。
四、未来发展
- 优化交互方式:OpenAI正在优化语音模式的交互方式,以减少其“打断感”,提升用户体验。
- 面向免费用户:OpenAI透露,未来高级语音模式也将面向免费用户开放,但具体时间尚未确定。
- 新功能整合:OpenAI计划在未来将新的搜索体验引入ChatGPT高级语音模式和画布界面(Canvas),进一步提升产品的功能和用户体验。
五、订阅方式:WildCard
想付费订阅去使用这个功能,用这个WildCard平台,支持移动端、PC端、H5三端互通,没有魔力也可以使用和订阅ai产品。