每日AI资讯07-311.OpenAI为ChatGPT Plus用户推出高级语音功能 2.京东云:智能体、数字人助业务创

每日AI资讯07-31

新闻摘要

1.OpenAI为ChatGPT Plus用户推出高级语音功能

2.京东云:智能体、数字人助业务创新

3.亚马逊 AI 帮你轻松挑选商品

4.OpenAI 推出 ChatGPT 语音助手

5.视频大模型Vidu全球正式上线

6.中国数字文娱大会2024:沉浸式科技体验

7.元宇宙和Mistral发布新开源文本LLM

8.Endava全员部署ChatGPT Enterprise

9.Meta推出AI Studio，打造个性化AI数字替身

10.绵阳打造人工智能产业新高地

11.火山引擎以AI大模型推动游戏玩法创新

12.MiniMax与值得买合作，将AI整合至消费场景

13.IDC 报告:工业大模型发展现状及展望

14.Orange Innovation 的人工智能突破成果

扫码加入AI交流群

获得更多技术支持和交流

（请注明自己的职业）

123

1.OpenAI为ChatGPT Plus用户推出高级语音功能

OpenAI已开始向ChatGPT Plus订阅者的一个小部分用户推出ChatGPT聊天机器人的高级语音功能。这项功能最初是在5月份春季更新中预告的，当时也发布了其GPT-4o模型。

这项高级语音功能允许用户与ChatGPT进行更自然的实时对话。它还可以感知和回应用户的情绪，并且用户可以随时打断对话。用户可以通过一句熟悉的短语“嘿，ChatGPT”呼叫ChatGPT。

OpenAI表示，高级语音功能将在未来几周内扩展到更多订阅用户，并计划在秋季为所有Plus成员提供该功能。

此外，Plus会员还可获得无限访问GPT-4o以及对新功能的优先访问。与免费版本不同，免费版本在遇到过多查询或流量过高时将降级到较早的GPT-3.5模型。

2.京东云:智能体、数字人助业务创新

在2024京东云峰会上，京东云展示了其在智能体、数字人、具身智能领域取得的成果。京东集团技术委员会主席曹鹏表示，京东供应链是这些技术的超级孵化器，京东云正在持续打磨和沉淀大模型应用，为客户提供专业服务。京东探索研究院院长何晓冬认为，智能体、数字人、具身智能将是未来大模型与终端用户的核心交互方式。现阶段，京东内部已拥有3300多个智能体，在超100个AI场景中应用于京东自有配送员、商家、医生、采销运营、研发等多个领域。

京东云言犀智能体平台已接入数十个大模型，用户可轻松搭建基于AI模型的应用。此外，京东云言犀数字人3.0平台不断进化，在多模态交互、智能交互方面都取得了显著提升。它活跃于直播、文旅导览、智能导购、金融客服等多个领域。

3.亚马逊 AI 帮你轻松挑选商品

亚马逊宣布，其 AI 技术生成的评论精华已在亚马逊购物应用的美国版本中全面发生。

这种新的功能将利用人工智能技术自动筛选出评论中的关键信息，并以简洁易懂的方式呈现给用户。这项创新旨在帮助消费者快速了解商品的优缺点，从而更明智地进行购物决策。

4.OpenAI 推出 ChatGPT 语音助手

OpenAI 推出ChatGPT语音助手早期版本，面向部分付费用户开放。该版本没有包括之前引发争议的被指模仿 Scarlett Johansson 语音的“Sky”选项。OpenAI 之前因声助手演示中包含与 Johansson 近期电影角色音效相似的声音而延迟了发布，并最终确认该声音与 Johansson 毫无关系，只是参考了公众人物的声音风格。

为了保护声部演员隐私，OpenAI 没有透露“Sky”的真实身份。OpenAI 表示，他们与业界领先的演员和导演合作，从 400 多个候选人中选择了 5 个声音，并计划在未来添加更多选项。该语音助手将逐步向所有 GPT-Plus 用户开放。

5.视频大模型Vidu全球正式上线

7月30日，AI生成视频大模型Vidu正式开放给全球用户使用。Vidu由清华大学教授、生数科技首席科学家朱军领导团队开发，是国内最早宣布“对标”Sora视频模型的大模型之一。

Vidu相比于同类产品，在视频生成速度和画面质量方面都有所提升。

速度: Vidu可生成4秒视频仅需30秒，是业内最快水平的Gen-3工具的两倍。
画质: Vidu画面质量能达到接近电影级的标准，支持1080P分辨率，并能生成影视级特效画面。

Vidu的免费版本每月提供80积分，可生成4秒视频并支持超清模式。此外，Vidu还提供商用、去除水印等功能的套餐。为了促进平台发展，Vidu还开放了API，并正在寻找第一批种子用户进行测试。

6.中国数字文娱大会2024:沉浸式科技体验

2024年中国数字文娱大会将于近期举办，大会将展示众多沉浸式科技体验，包括3D虚拟现实、人工智能生成内容（AIGC）以及XR技术等。

今年大会将聚焦于:

交互式3D体验: 观众可以身临其境地体验3D虚拟世界，例如虚拟偶像演唱会、虚拟博物馆等。
虚拟生产: 利用人工智能技术生成逼真的高保真视频、音频和图像内容，为观众打造更加沉浸式的体验。

大会还将展示最新的LED显示技术、AR技术与5G技术应用于数字文娱领域的创新案例。

该大会预计将吸引来自全球的数字文娱行业参与者，共同探讨未来数字文化的發展方向。

7.元宇宙和Mistral发布新开源文本LLM

近期，Meta和Mistral发布了两种全新的开源大语言模型（LLM）。这些模型性能更高，价格也更具竞争力。Meta的Llama 3.1 405b模型包含4050亿个参数，并且在代码生成、数学问题解决和八种语言（英语、德语、法语、意大利语、波葡萄牙语、印地语、西班牙语和泰语）的文档总结等方面与OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet等领先模型相当。该模型可以通过AWS、Azure和Google Cloud等云平台下载或使用，目前已经在WhatsApp和Meta.ai应用。Mistral Large 2也是一种仅处理文本的模型，它不能处理图像。与OpenAI的多模态AI系统相比，这种模型在处理图像和文本方面落后。Mistral公司表示，Large 2在代码生成、数学和推理方面的能力显著增强，同时还提供了更强的多语言支持和高级函数调用功能。 Mistral Large 2可以在Google Vertex AI、Amazon Bedrock、Azure AI Studio以及IBM Watsonx.ai上使用，其权重也托管在HuggingFace上。

8.Endava全员部署ChatGPT Enterprise

Endava公司宣布与OpenAI展开战略合作，将为其逾11000名全球员工部署ChatGPT Enterprise许可证。此举标志着Endava致力于利用尖端人工智能技术为客户创造价值的关键一步。Endava计划利用ChatGPT的先进语言模型和功能，提升运营效率，推动创新，帮助客户获得更快的成果。

Endava首席技术官Matt Cloke表示:“人工智能必将改变产品创新、精简业务流程以及塑造满足并超越客户需求的技术。”"OpenAI 是生成式人工智能技术领域的先驱，通过ChatGPT Enterprise，Endava能够获得企业级安全和隐私保障，并使用迄今为止最强大的ChatGPT版本。” 为确保员工最大程度地利用这项强大工具并负责任地使用它，Endava将推出关于人工智能使用的新规培训课程。

9.Meta推出AI Studio，打造个性化AI数字替身

Meta发布AI Studio，让用户可以创建基于他们自己社交媒体数据训练的个性化AI聊天机器人。AI Studio类似于OpenAI的GPT，允许用户打造专门满足特定需求的AI模型。现在，通过AI Studio，用户可以利用自己Facebook、Instagram、WhatsApp等平台上的内容，例如帖子、评论、故事和视频，训练出一个模仿自身风格和想法的AI聊天机器人。

这个AI替身可以用来与粉丝互动，快速回复常见问题，也可以作为私人助理，只与用户本身或指定好友交流。用户可以选择将AI公开展示在Instagram头像上，或者将它私下使用。Meta提供了一份详细的使用指南，教用户如何训练AI、设置隐私权限，以及如何引导AI避开敏感话题。目前，AI Studio仅在美国提供服务。

10.绵阳打造人工智能产业新高地

2024首届人工智能先进技术成果供需对接大会在四川省绵阳市举行。大会以“人工智能，供需互联”为主题，旨在促进人工智能供需对接，助力完善人工智能产业生态。会上，150多家头部企业集中展示人工智能最新技术成果，涵盖人形机器人、智能控制无人系统等方向。大会期间，人工智能供需对接合作及招商引资项目共计23个项目相继签约，签约总金额达100.43亿元。其中，绵阳科技城新区签署两个重大项目，分别与华为技术有限公司和虚谷伟业科技有限公司达成合作，将围绕智慧交通、低空经济打造更多人工智能应用场景。此次活动的举行有力地推动了绵阳人工智能产业发展，展示了城市发展人工智能的坚定决心。绵阳正朝着人工智能创新策源地、企业集聚地、产业新高地的目标迈进。

11.火山引擎以AI大模型推动游戏玩法创新

2024年7月26日至29日，第二十一届中国国际数码互动娱乐展会（ChinaJoy）在上海举行。火山引擎南区游戏行业解决方案负责人杨旭东应邀参会并发表了题为《创新驱动，畅享无限:字节跳动豆包大模型为游戏世界注入全新可能》的主题演讲，介绍了火山引擎基于AI大模型等技术推出的游戏AI解决方案。

火山引擎的新游戏AI解决方案主要有两点升级:其一是对原本的核心能力，特别是AI方面进行了升级，其二是在场景部分结合豆包大模型的语音、语言，图形等能力进行了升级。这个解决方案基于字节跳动自身业务中丰富的AI应用场景打磨出卓越的AI基础能力，通过AI开放平台向企业提供即开即用的AI原子化能力，并以AI开发平台助力用户进行各种AI模型的一站式开发。此外，火山方舟平台还支持企业直接调用大模型推理和自助进行模型精调。

AI大模型正在加速游戏行业变革，越来越多的游戏企业试图通过AI大模型探索更多新互动模式和新玩法。杨旭东认为，当前游戏行业在玩法创新上主要聚焦于三个核心场景:闯关类、情感陪伴类和NPC智能体类。这些场景都得到了AI大模型的推动，使得游戏的交互性和可玩性得到了显著增强。

但为了开发这类游戏，需要极其深入、复杂的的技术能力。依托豆包大模型更强模型、更低价格、更易落地的特性，以及字节跳动旗下多样化产品和平台的支持，火山引擎游戏AI解决方案凝练出三大优势，帮游戏企业转型升级。这些优势包括大规模业务支撑、独特插件和丰富生态。未来火山引擎将继续深耕游戏行业，基于AI大模型，打造集游戏开发、测试、部署和推广于一体的一站式服务，驱动业务增长。

12.MiniMax与值得买合作，将AI整合至消费场景

7月29日，MiniMax和值得买科技宣布成为官方合作伙伴。MiniMax旗下AI产品海螺AI 已接入值得买平台，通过“悬浮球”功能，用户可以快速比价并跳转购买商品。海螺AI基于MiniMax自主开发的万亿参数大模型abab6.5，支持多种模态交互，可理解文本、音频和图像。MiniMax认为，通用大模型与垂直大模型的融合是行业趋势。值得买拥有丰富的消费领域数据和用户经验，与MiniMax的合作将实现优势互补，提升用户体验和商业价值。值得买科技CTO王云峰表示，通过与更广泛行业的合作，能够增强通用大模型的应用能力，并帮助值得买持续收集用户反馈和趋势信息，推动AI能力迭代，激发消费场景下的创新。

13.IDC 报告:工业大模型发展现状及展望

IDC 的最新报告深入探讨了工业大模型在过去一年中的落地现状及未来展望。报告将分析工业大模型在各行业应用的趋势，包括制造、能源、金融等领域，并对模型构建、数据准备、算法优化等方面的挑战和机遇进行深入分析。 IDC 预计，未来工业大模型将迎来更Rapid 的发展，并将在推动企业数字化转型的进程中扮演更重要角色。

14.Orange Innovation 的人工智能突破成果

Orange Innovation 的研究人员在 Lannion 的总部开展了各种前沿人工智能研究，取得了显著突破。其中一项研究重点是增强人工智能在文本分析方面的能力。他们开发了一种新颖的方法，使人工智能能够处理和分析数百页长的复杂文档，提取关键信息和核心信息，例如合同条款或发票详情。这项技术超越了目前最知名的AI模型ChatGPT，后者只能处理少量文档（最多10页）。

该技术的内部应用使Orange能够更高效地审阅和比较大量的文本数据，节省时间和人力资源。此外，Lannion的研究者们还在致力于减少用户数据存储设施的碳排放。他们开发了一系列新的工具和技术，通过优化能源消耗、延长设备使用寿命以及与可持续供应商合作，努力实现集团在2040年之前实现碳中和的目标。

关注「阿杰与AI」公众号

与AI时代更靠近一点