ChatGPT现在具备了听、说和看的能力。全新的声音和图像功能正在逐步推出。这些功能为用户提供了一种更直观的交互界面,允许您通过语音进行对话或者通过图像直观地展示您所讨论的内容。
声音和图像功能为您在日常生活中使用ChatGPT提供了更多方式。例如,您可以在旅行中拍摄一个地标,然后通过语音与ChatGPT进行实时对话,探讨这个地标的有趣之处。当您在家时,您可以拍摄冰箱和食品储藏室的照片,来决定今晚吃什么(还可以通过进一步的问题获取逐步的食谱)。晚餐后,您还可以帮助您的孩子解决数学问题,只需拍下问题、圈出问题集,ChatGPT就会与您共享解题的提示。
这些全新的声音和图像功能将在接下来的两周内向Plus和Enterprise用户推出。声音功能将在iOS和Android平台上推出(需要在您的设置中选择加入),而图像功能将在所有平台上可用。
等了许久的多模态功能终于要上线了,演示的demo还是很牛的,期待体验。
ps. 今天试用了一下阿里的通义千问,也还算不错,后面可以尝试进行一下微调。