2024.11.22日咨询OpenAI首席产品官宣布ChatGPT网页端本周引入高级语音模式北京时间本周三凌晨，Open

一：事件背景

北京时间本周三凌晨，OpenAI 首席产品官凯文・威尔（Kevin Weil）通过 X 平台确认，高级语音模式（Advanced Voice Mode）在本周全面上线 ChatGPT 网页版，面向付费用户开启。

ChatGPT，作为OpenAI开发的人工智能聊天机器人，凭借其强大的自然语言处理能力和高度的智能化水平，已经赢得了全球用户的广泛赞誉。而此次引入的高级语音模式，更是将ChatGPT的交互体验提升到了一个新的高度。

据悉，高级语音模式依托最新的GPT-4o模型，实现了与用户的实时互动。用户只需在ChatGPT网页版中点击提示窗口右下角的语音图标，并授予浏览器使用麦克风的权限，即可轻松启动该功能。在高级语音模式下，ChatGPT不仅能够用自然语言与用户进行流畅的交流，还能够感知用户的语调和语速等非语言信号，并在回应时模仿情绪，使对话更加生动真实。

此外，高级语音模式还提供了多种不同的声音风格供用户选择。无论是随和的“Arbor”语气，还是自信乐观的“Ember”风格，用户都可以根据自己的喜好进行个性化设置。同时，用户还可以通过设置自定义指令来定制ChatGPT的说话方式，如特定的节奏、发音清晰度、慢速说话等，以满足不同场景下的需求。

值得一提的是，高级语音模式在推出初期将面向ChatGPT Plus、Team、Enterprise和Edu的付费用户开放。虽然Plus和Teams用户每天的语音使用量都有上限，但OpenAI表示，未来该功能也将面向免费用户开放，让更多人享受到AI技术带来的便利。

除了高级语音模式外，OpenAI还在不断优化ChatGPT的其他功能。例如，他们正在探索如何减少语音模式的“打断感”，以提升用户体验。同时，OpenAI还计划将新的搜索体验引入ChatGPT高级语音模式和画布界面（Canvas），进一步丰富产品的功能和应用场景。

总的来说，ChatGPT网页端引入的高级语音模式是一项令人振奋的更新。它不仅提升了用户与AI助手的交互体验，还展示了OpenAI在AI技术领域的创新能力和领先地位。相信随着技术的不断进步和应用的不断拓展，ChatGPT将在未来为我们带来更多惊喜和便利。

二、功能介绍

名称：高级语音模式（Advanced Voice Mode）。
上线平台：ChatGPT网页版。
面向用户：初期面向ChatGPT Plus、Team、Enterprise和Edu的付费用户开放。
功能特点：
- 原生音频处理能力：高级语音模式依托最新的GPT-4o模型，能够用自然语言与用户进行实时互动。
- 感知非语言信号：能够感知用户的语调和语速等非语言信号，并在回应时模仿情绪，使对话更加生动真实。
- 个性化声音选项：提供了多种不同的声音风格供用户选择，如“Arbor”代表随和的语气，“Ember”则表达自信与乐观。
- 自定义指令：用户可以通过设置自定义指令来定制ChatGPT的说话方式，如特定的节奏、发音清晰度、慢速说话等。
- 多语言支持：ChatGPT可使用50种语言说“对不起，我迟到了”，并能根据谈话的语气调整声音。

三、使用方式

启动方式：已订阅付费计划的用户，点击ChatGPT网页版提示窗口右下角的语音图标，即可启动高级语音模式。但前提是需授予浏览器使用麦克风的权限。
语音使用量限制：Plus和Teams用户每天的语音使用量都有上限，当达到上限时，系统会发出提醒。

四、未来发展

优化交互方式：OpenAI正在优化语音模式的交互方式，以减少其“打断感”，提升用户体验。
面向免费用户：OpenAI透露，未来高级语音模式也将面向免费用户开放，但具体时间尚未确定。
新功能整合：OpenAI计划在未来将新的搜索体验引入ChatGPT高级语音模式和画布界面（Canvas），进一步提升产品的功能和用户体验。

五、订阅方式：WildCard

想付费订阅去使用这个功能，用这个WildCard平台，支持移动端、PC端、H5三端互通，没有魔力也可以使用和订阅ai产品。