每日AI资讯06-031.OpenAI被曝重组与苹果达成数十亿美元合作，微软紧急应对 2.OpenAI 重启机器人团队

每日AI资讯06-03

新闻摘要

1.OpenAI被曝重组与苹果达成数十亿美元合作，微软紧急应对

2.OpenAI 重启机器人团队

3.英伟达发布新一代GPU Blackwell，推动AI能耗革命

4.Nvidia推出游戏AI助手Project G-Assist

5.AnythingLLM：零成本的私人ChatGPT，支持几乎所有主流大模型

6.Suno发布V3.5模型，免费制作4分钟歌曲

7.科大讯飞：讯飞星火V4.0对标GPT-4，预计2024年6月底发布

8.苹果坚持自研芯片,不依赖英伟达

9.Google为Chromebooks推出五大AI功能

10.极越01：首款融合AI大模型的智能汽车

11.ElevenLabs推出AI生成音效工具

12.中美大模型角逐：美国卷技术、中国卷价格

13.利用AI、数字孪生和AR/VR进行军用飞机维护

14.大模型赋能教育深度融合AI路径

15.AI开发成本飙升科技巨头垄断加剧

16.AI训练需求暴增面临数据短缺

扫码加入交流群

获得更多技术支持和交流

（请注明自己的职业）

123

1.OpenAI被曝重组与苹果达成数十亿美元合作，微软紧急应对

OpenAI和苹果已确定联手，达成一项可能价值数十亿美元的交易。苹果将在多大程度上使用OpenAI的技术尚不清楚，但这一消息让微软CEO纳德拉感到不安。据悉，纳德拉已经与OpenAI CEO Sam Altman进行了紧急会谈。苹果计划对Siri进行AI现代化改造，让用户仅用语音即可控制所有应用。该功能最早将在2025年推出的iOS 18中实现。苹果还计划在6月的全球开发者大会上揭示其AI战略，重点增强Siri和集成更多AI功能。OpenAI的合作将使其对话AI被应用于苹果产品中，可能带来数十亿美元收入，并提升其科技行业地位。然而，这也使得微软与OpenAI的关系变得复杂，微软担心这将影响其产品计划。与此同时，OpenAI在寻找其他项目，包括建立全球性的AI服务器芯片工厂和开发AI驱动的个人设备。

2.OpenAI 重启机器人团队

据福布斯报道，OpenAI 正式重启其先前放弃的机器人团队，并已确认这一消息。OpenAI 成立初期，机器人技术就是其主攻方向之一，联合创始人沃伊切赫・扎伦巴领导的团队曾试图打造“通用机器人”。2019 年，OpenAI 研究人员曾通过训练神经网络使用机械手复原魔方，展现了机器人系统执行各种日常任务的潜力。但在 2020 年 10 月，因缺乏训练数据，OpenAI 放弃了这一努力。过去一年，OpenAI 内部创业基金投资了多家公司，如 Figure AI、1X Technologies 和 Physical Intelligence，这些公司致力于开发人形机器人。Figure AI 今年 3 月发布的视频展示了由 OpenAI 训练的大型多模态模型支持的基本语言和推理技能。目前，OpenAI 计划与这些公司合作，而非竞争，并正在招聘研究工程师重建团队。招聘信息显示，新团队将与外部合作伙伴合作，训练 AI 模型。

3.英伟达发布新一代GPU Blackwell，推动AI能耗革命

英伟达创始人兼CEO黄仁勋展示新一代GPU Blackwell，宣称8年内将GPT-4训练能耗降至1/350，推理能耗降至1/45000，产品迭代速度突破摩尔定律，未来还将推出Blackwell Ultra、Rubin和Rubin Ultra三代GPU。黄仁勋表示，英伟达通过GPU和CUDA加速计算，推动AI发展，形成"AI工厂"，实现计算和能源效率的革命性提升。最新Blackwell GPU和超级计算机DGX将支持更高效的AI训练和推理，推动生成式AI进入各领域。英伟达计划通过Nvidia NIM软件，加速全球2800万开发者部署LLM，推动AI应用广泛落地。未来的智能体和数字人将利用多模态AI，实现更自然的人机交互，广泛应用于各行各业。黄仁勋强调，英伟达将继续创新，推动AI和物理世界的深度融合。

4.Nvidia推出游戏AI助手Project G-Assist

在Computex 2024，Nvidia展示了Project G-Assist，帮助玩家提升游戏表现的AI助手。该助手利用大语言模型（LLM）连接游戏知识数据库，为玩家提供策略和操作建议。玩家可通过语音或文字向AI助手询问游戏中的问题。Nvidia与Studio Wildcard合作展示了AI助手在《Ark: Survival Ascended》中的应用，回答生物、制作物品和挑战BOSS的问题，并优化游戏系统性能。Project G-Assist将包含在RTX AI开发工具包中，具体实现时间取决于开发商行动。

5.AnythingLLM：零成本的私人ChatGPT，支持几乎所有主流大模型

AnythingLLM是由Mintplex Labs Inc.开发的全栈应用程序，旨在解决企业在大模型应用中的幻觉和知识局限性问题。它支持几乎所有主流大模型和多种文档类型，可定制且开源。用户可以选择免费使用Desktop版，或通过每月25美元的云托管服务获得更多功能。AnythingLLM确保数据存储在本地，用户无需担心隐私泄露。配置简单，支持多用户模式和权限管理，适用于MacOS、Linux和Windows系统。虽然目前有些回答不够准确，但它在多用户管理、文档支持和成本优化方面具有显著优势，未来有望在文本召回和重排等方面进一步优化。

6.Suno发布V3.5模型，免费制作4分钟歌曲

备受关注的“乐坛 ChatGPT” Suno近日发布了V3.5版本，并向所有用户开放。用户现在可以免费创作4分钟的歌曲，并生成最长2分钟的扩展版本，同时体验改进的歌曲结构和声音流畅度。Suno是一款生成式人工智能音乐创作平台，能够合成人声与乐器，创作出逼真的歌曲。该平台此前在3月21日发布的V3版本支持用户创作2分钟的歌曲，而V3.5版本则延长了歌曲时长并提升了音质。用户只需提供歌词，Suno即可生成不同曲风和流派的歌曲，甚至可以选择AI歌手的音色。官方透露，V4版本已经在开发中，且正在积极开发新功能。Suno强调，其初衷是创作原创音乐，模型无法识别其他艺术家的作品。

7.科大讯飞：讯飞星火V4.0对标GPT-4，预计2024年6月底发布

有投资者在互动平台询问科大讯飞是否计划开发类似ChatGPT-4的技术，并实现毫秒级响应和辅导做题功能。科大讯飞回应称，目前正在训练对标GPT-4能力的讯飞星火V4.0，预计将在2024年6月底发布。此外，科大讯飞也在研发对标GPT-4的产品。科大讯飞表示，其AI学习机自2021年推出以来，凭借“4+1”标准（学情分析、学习推荐、语言提升、成效促信心、阳光绿色守护），一直深受用户好评，用户推荐NPS值始终保持行业领先。科大讯飞将继续结合人工智能的最新进展，不断提升智慧教育产品的用户体验和市场渗透率。

8.苹果坚持自研芯片,不依赖英伟达

与OpenAI、微软、谷歌和英伟达相比，苹果在AI研发方面面临挑战。OpenAI和微软合作推出先进的AI模型和服务，谷歌通过Google Cloud平台不断创新。苹果在技术积累、商业化进展和研发策略方面存在不足，但其突破点在于自研芯片。苹果坚持在AI领域不依赖英伟达，专注于自研芯片。其M系列芯片内置强大神经引擎，在设备本地高效处理AI任务。最新的M4芯片具备更强的计算和AI处理能力，支持每秒38万亿次运算。苹果强调隐私和数据安全，通过在本地设备上处理AI任务确保用户数据不外泄。苹果计划在全球开发者大会上揭幕其AI战略，重点增强Siri和集成更多AI功能。尽管面临挑战，苹果凭借其硬件整合能力和对隐私的承诺，仍有望通过自研芯片实现弯道超车。

9.Google为Chromebooks推出五大AI功能

Google为Chromebook Plus（高端Chrome OS硬件标准）推出了五大AI功能：Google Photos的Magic Editor，允许用户重新定位和调整对象大小、改进光线和背景等；集成Gemini，可以帮助用户回答问题、计划旅行、研究主题等，新用户可免费使用Google One AI Premium计划12个月；Help Me Write功能提供写作建议，帮助生成或改写文本；AI生成的壁纸和视频通话背景，用户可以使用AI生成的图像作为壁纸或视频通话背景；快速访问Google Tasks，用户可以通过主页屏幕底部右侧的日期图标或Google Workspace应用快速访问Google Tasks。这些新功能将在2024年5月28日或之后的最新Chrome OS版本中向Chromebook Plus设备推出。

10.极越01：首款融合AI大模型的智能汽车

极越01是吉利和百度合作推出的智能汽车品牌极越的首款车型，结合了吉利的硬件优势和百度的AI技术。作为中大型纯电SUV，极越01拥有宽敞的乘坐空间和高性能的驾驶体验，搭载前全铝双叉臂和后全铝H-Arm多连杆悬架，配备CDC实时阻尼可调减振器和Brembo高性能运动卡钳，实现3.8秒的零百加速。在智能化方面，极越01全系标配高通8295和双Orin-X芯片，AI算力达568 TOPS，采用BEV+OCC+Transformer纯视觉方案，提升了驾驶安全性和自然感。其语音交互系统SIMO融合了文心一言4.0能力，语音识别速度快至500ms，支持多模态交互和全域全离线语音，即便在弱网环境下依然能实现极速交互。极越01结合了吉利的硬件优势和百度的智能化技术，支持OTA升级，不断优化用户体验，是一款更为智能化的高性能SUV。

11.ElevenLabs推出AI生成音效工具

ElevenLabs发布了一个AI驱动的新工具，用户可以通过输入提示词生成音效。该工具今日上线，允许用户输入如“海浪拍打”、“金属碰撞”、“鸟鸣”和“赛车引擎”等提示词来生成声音片段。此外，还能生成长达22秒的乐器音乐片段，如吉他循环、爵士萨克斯独奏和电子音乐循环。免费用户每月可生成1万个字符，约60个音效片段，并需注明“elevenlabs.io”发布内容。该工具使用Shutterstock的音频库训练，测试阶段参与者包括游戏开发者、电影制片人、社交媒体内容创作者和市场营销人员。ElevenLabs禁止生成违反其内容政策的声音，如自我伤害、儿童安全威胁和欺诈等内容。尽管目前AI生成音效的公司不多，但ElevenLabs可能面临与Stability AI、谷歌、OpenAI、Meta、TikTok和Adobe等竞争对手的激烈竞争。

12.中美大模型角逐：美国卷技术、中国卷价格

中美在大模型领域展开激烈竞争，美国主要在技术上发力，推出了如OpenAI的GPT-4o、谷歌的Gemini系列、苹果的AI芯片M4等新产品。而中国则在价格上展开竞争，如智谱AI、字节跳动、阿里云、百度和科大讯飞等相继降低了大模型API调用价格，甚至部分提供免费服务。尽管技术能力是大模型的核心，但受制于算力等因素，中国大模型厂商不得不通过降低价格吸引用户和开发者，以推动大模型的落地应用。这种价格战虽然可能加剧市场竞争，但有助于加速大模型的普及和生态建设，实现技术与应用的共同发展。

13.利用AI、数字孪生和AR/VR进行军用飞机维护

先进技术如人工智能、数字孪生和增强/虚拟现实正在彻底改变传统的飞机维护和修理方法。航空航天和军工制造商越来越多地采用创新解决方案，以优化维护程序、增强安全协议并降低运营成本。AI驱动的预测性维护通过数据分析和机器学习算法，在故障发生前预测潜在问题，从而主动安排修理。数字孪生通过虚拟表示飞机的实际状态，使操作员能够优化维护活动和备件管理。AR/VR技术提供实时指导和沉浸式培训，提高了技术人员的效率和熟练程度。这些技术的应用将大大改善飞机维护和修理的流程，提高整体安全性和可靠性。

14.大模型赋能教育深度融合AI路径

“教育+AI”创新应用论坛在中关村互联网教育创新中心举办，旨在探索人工智能与教育深度融合路径。北京市教育委员会信息化处处长吴雅星指出，教育数字化转型需全面融合AI，推动优质教育均衡发展。专家余胜泉强调，智能技术应促进个性化教育发展。海淀区教育科学研究院院长吴颖惠介绍了AI在教育中的具体应用，包括试点学校、教师培训和课程体系建设。各校代表分享了AI在教学中的实践和经验。圆桌论坛上，校长们探讨了AI在教育中的应用现状和挑战，并提出未来的创新方向。副区长武凯总结强调，AI技术是未来教育发展的关键，应加强教育科技人才一体化发展，推动教学创新，为区域经济社会发展注入新动能。

15.AI开发成本飙升科技巨头垄断加剧

AI训练数据、模型规模、芯片和数据中心的需求急剧增加，推高了科技公司的成本。OpenAI与美国新闻集团签订了一项五年内金额超2.5亿美元的协议，用于AI训练。OpenAI CEO奥尔特曼表示，训练GPT-4的成本超1亿美元。英伟达的H100芯片售价约3万美元，Meta计划购买35万块。此外，云服务中心的建设成本也在增加。微软季度资本支出达140亿美元，谷歌母公司Alphabet为120亿美元，Meta预期支出达350亿至400亿美元。这些高额成本使得只有大型科技公司能在AI竞赛中竞争。欧美反垄断机构已开始关注这些科技巨头在AI领域的垄断地位。

16.AI训练需求暴增面临数据短缺

随着AI大模型训练需求的增长，数据资源日益紧张。据Epoch AI预测，AI公司可能在2026年前耗尽高质量文本数据，而低质量数据可能在2030至2060年间枯竭。数据是AI发展的核心资源，训练数据越多，AI模型的能力越强。然而，随着需求增加，可用的公共数据资源变得稀缺。OpenAI的GPT-4训练量高达12万亿个数据点，GPT-5可能需要60万亿到100万亿个数据。高质量数据被视为AI训练的“金矿”，但也带来了版权问题。媒体和社交平台如CNN、《纽约时报》等已采取措施防止数据被滥用。OpenAI正在与媒体和社交平台达成合作协议，以解决版权争议。此外，部分公司使用自身数据训练AI，但这可能存在隐私泄露风险。还有公司尝试使用合成数据，但偏差问题可能导致AI模型崩溃。

关注「阿杰与AI」公众号

与AI时代更靠近一点