每日AI资讯06-03

143 阅读2分钟

每日AI资讯06-03

新闻摘要

1.OpenAI被曝重组与苹果达成数十亿美元合作,微软紧急应对

2.OpenAI 重启机器人团队

3.英伟达发布新一代GPU Blackwell,推动AI能耗革命

4.Nvidia推出游戏AI助手Project G-Assist

5.AnythingLLM:零成本的私人ChatGPT,支持几乎所有主流大模型

6.Suno发布V3.5模型,免费制作4分钟歌曲

7.科大讯飞:讯飞星火V4.0对标GPT-4,预计2024年6月底发布

8.苹果坚持自研芯片,不依赖英伟达

9.Google为Chromebooks推出五大AI功能

10.极越01:首款融合AI大模型的智能汽车

11.ElevenLabs推出AI生成音效工具

12.中美大模型角逐:美国卷技术、中国卷价格

13.利用AI、数字孪生和AR/VR进行军用飞机维护

14.大模型赋能教育 深度融合AI路径

15.AI开发成本飙升 科技巨头垄断加剧

16.AI训练需求暴增 面临数据短缺

扫码加入交流群

获得更多技术支持和交流

(请注明自己的职业)

123

1.OpenAI被曝重组与苹果达成数十亿美元合作,微软紧急应对

OpenAI和苹果已确定联手,达成一项可能价值数十亿美元的交易。苹果将在多大程度上使用OpenAI的技术尚不清楚,但这一消息让微软CEO纳德拉感到不安。据悉,纳德拉已经与OpenAI CEO Sam Altman进行了紧急会谈。苹果计划对Siri进行AI现代化改造,让用户仅用语音即可控制所有应用。该功能最早将在2025年推出的iOS 18中实现。苹果还计划在6月的全球开发者大会上揭示其AI战略,重点增强Siri和集成更多AI功能。OpenAI的合作将使其对话AI被应用于苹果产品中,可能带来数十亿美元收入,并提升其科技行业地位。然而,这也使得微软与OpenAI的关系变得复杂,微软担心这将影响其产品计划。与此同时,OpenAI在寻找其他项目,包括建立全球性的AI服务器芯片工厂和开发AI驱动的个人设备。

2.OpenAI 重启机器人团队

据福布斯报道,OpenAI 正式重启其先前放弃的机器人团队,并已确认这一消息。OpenAI 成立初期,机器人技术就是其主攻方向之一,联合创始人沃伊切赫・扎伦巴领导的团队曾试图打造“通用机器人”。2019 年,OpenAI 研究人员曾通过训练神经网络使用机械手复原魔方,展现了机器人系统执行各种日常任务的潜力。但在 2020 年 10 月,因缺乏训练数据,OpenAI 放弃了这一努力。过去一年,OpenAI 内部创业基金投资了多家公司,如 Figure AI、1X Technologies 和 Physical Intelligence,这些公司致力于开发人形机器人。Figure AI 今年 3 月发布的视频展示了由 OpenAI 训练的大型多模态模型支持的基本语言和推理技能。目前,OpenAI 计划与这些公司合作,而非竞争,并正在招聘研究工程师重建团队。招聘信息显示,新团队将与外部合作伙伴合作,训练 AI 模型。

3.英伟达发布新一代GPU Blackwell,推动AI能耗革命

英伟达创始人兼CEO黄仁勋展示新一代GPU Blackwell,宣称8年内将GPT-4训练能耗降至1/350,推理能耗降至1/45000,产品迭代速度突破摩尔定律,未来还将推出Blackwell Ultra、Rubin和Rubin Ultra三代GPU。黄仁勋表示,英伟达通过GPU和CUDA加速计算,推动AI发展,形成"AI工厂",实现计算和能源效率的革命性提升。最新Blackwell GPU和超级计算机DGX将支持更高效的AI训练和推理,推动生成式AI进入各领域。英伟达计划通过Nvidia NIM软件,加速全球2800万开发者部署LLM,推动AI应用广泛落地。未来的智能体和数字人将利用多模态AI,实现更自然的人机交互,广泛应用于各行各业。黄仁勋强调,英伟达将继续创新,推动AI和物理世界的深度融合。

4.Nvidia推出游戏AI助手Project G-Assist

在Computex 2024,Nvidia展示了Project G-Assist,帮助玩家提升游戏表现的AI助手。该助手利用大语言模型(LLM)连接游戏知识数据库,为玩家提供策略和操作建议。玩家可通过语音或文字向AI助手询问游戏中的问题。Nvidia与Studio Wildcard合作展示了AI助手在《Ark: Survival Ascended》中的应用,回答生物、制作物品和挑战BOSS的问题,并优化游戏系统性能。Project G-Assist将包含在RTX AI开发工具包中,具体实现时间取决于开发商行动。

5.AnythingLLM:零成本的私人ChatGPT,支持几乎所有主流大模型

AnythingLLM是由Mintplex Labs Inc.开发的全栈应用程序,旨在解决企业在大模型应用中的幻觉和知识局限性问题。它支持几乎所有主流大模型和多种文档类型,可定制且开源。用户可以选择免费使用Desktop版,或通过每月25美元的云托管服务获得更多功能。AnythingLLM确保数据存储在本地,用户无需担心隐私泄露。配置简单,支持多用户模式和权限管理,适用于MacOS、Linux和Windows系统。虽然目前有些回答不够准确,但它在多用户管理、文档支持和成本优化方面具有显著优势,未来有望在文本召回和重排等方面进一步优化。

6.Suno发布V3.5模型,免费制作4分钟歌曲

备受关注的“乐坛 ChatGPT” Suno近日发布了V3.5版本,并向所有用户开放。用户现在可以免费创作4分钟的歌曲,并生成最长2分钟的扩展版本,同时体验改进的歌曲结构和声音流畅度。Suno是一款生成式人工智能音乐创作平台,能够合成人声与乐器,创作出逼真的歌曲。该平台此前在3月21日发布的V3版本支持用户创作2分钟的歌曲,而V3.5版本则延长了歌曲时长并提升了音质。用户只需提供歌词,Suno即可生成不同曲风和流派的歌曲,甚至可以选择AI歌手的音色。官方透露,V4版本已经在开发中,且正在积极开发新功能。Suno强调,其初衷是创作原创音乐,模型无法识别其他艺术家的作品。

7.科大讯飞:讯飞星火V4.0对标GPT-4,预计2024年6月底发布

有投资者在互动平台询问科大讯飞是否计划开发类似ChatGPT-4的技术,并实现毫秒级响应和辅导做题功能。科大讯飞回应称,目前正在训练对标GPT-4能力的讯飞星火V4.0,预计将在2024年6月底发布。此外,科大讯飞也在研发对标GPT-4的产品。科大讯飞表示,其AI学习机自2021年推出以来,凭借“4+1”标准(学情分析、学习推荐、语言提升、成效促信心、阳光绿色守护),一直深受用户好评,用户推荐NPS值始终保持行业领先。科大讯飞将继续结合人工智能的最新进展,不断提升智慧教育产品的用户体验和市场渗透率。

8.苹果坚持自研芯片,不依赖英伟达

与OpenAI、微软、谷歌和英伟达相比,苹果在AI研发方面面临挑战。OpenAI和微软合作推出先进的AI模型和服务,谷歌通过Google Cloud平台不断创新。苹果在技术积累、商业化进展和研发策略方面存在不足,但其突破点在于自研芯片。 苹果坚持在AI领域不依赖英伟达,专注于自研芯片。其M系列芯片内置强大神经引擎,在设备本地高效处理AI任务。最新的M4芯片具备更强的计算和AI处理能力,支持每秒38万亿次运算。苹果强调隐私和数据安全,通过在本地设备上处理AI任务确保用户数据不外泄。苹果计划在全球开发者大会上揭幕其AI战略,重点增强Siri和集成更多AI功能。尽管面临挑战,苹果凭借其硬件整合能力和对隐私的承诺,仍有望通过自研芯片实现弯道超车。

9.Google为Chromebooks推出五大AI功能

Google为Chromebook Plus(高端Chrome OS硬件标准)推出了五大AI功能:Google Photos的Magic Editor,允许用户重新定位和调整对象大小、改进光线和背景等;集成Gemini,可以帮助用户回答问题、计划旅行、研究主题等,新用户可免费使用Google One AI Premium计划12个月;Help Me Write功能提供写作建议,帮助生成或改写文本;AI生成的壁纸和视频通话背景,用户可以使用AI生成的图像作为壁纸或视频通话背景;快速访问Google Tasks,用户可以通过主页屏幕底部右侧的日期图标或Google Workspace应用快速访问Google Tasks。这些新功能将在2024年5月28日或之后的最新Chrome OS版本中向Chromebook Plus设备推出。

10.极越01:首款融合AI大模型的智能汽车

极越01是吉利和百度合作推出的智能汽车品牌极越的首款车型,结合了吉利的硬件优势和百度的AI技术。作为中大型纯电SUV,极越01拥有宽敞的乘坐空间和高性能的驾驶体验,搭载前全铝双叉臂和后全铝H-Arm多连杆悬架,配备CDC实时阻尼可调减振器和Brembo高性能运动卡钳,实现3.8秒的零百加速。在智能化方面,极越01全系标配高通8295和双Orin-X芯片,AI算力达568 TOPS,采用BEV+OCC+Transformer纯视觉方案,提升了驾驶安全性和自然感。其语音交互系统SIMO融合了文心一言4.0能力,语音识别速度快至500ms,支持多模态交互和全域全离线语音,即便在弱网环境下依然能实现极速交互。极越01结合了吉利的硬件优势和百度的智能化技术,支持OTA升级,不断优化用户体验,是一款更为智能化的高性能SUV。

11.ElevenLabs推出AI生成音效工具

ElevenLabs发布了一个AI驱动的新工具,用户可以通过输入提示词生成音效。该工具今日上线,允许用户输入如“海浪拍打”、“金属碰撞”、“鸟鸣”和“赛车引擎”等提示词来生成声音片段。此外,还能生成长达22秒的乐器音乐片段,如吉他循环、爵士萨克斯独奏和电子音乐循环。免费用户每月可生成1万个字符,约60个音效片段,并需注明“elevenlabs.io”发布内容。该工具使用Shutterstock的音频库训练,测试阶段参与者包括游戏开发者、电影制片人、社交媒体内容创作者和市场营销人员。ElevenLabs禁止生成违反其内容政策的声音,如自我伤害、儿童安全威胁和欺诈等内容。尽管目前AI生成音效的公司不多,但ElevenLabs可能面临与Stability AI、谷歌、OpenAI、Meta、TikTok和Adobe等竞争对手的激烈竞争。

12.中美大模型角逐:美国卷技术、中国卷价格

中美在大模型领域展开激烈竞争,美国主要在技术上发力,推出了如OpenAI的GPT-4o、谷歌的Gemini系列、苹果的AI芯片M4等新产品。而中国则在价格上展开竞争,如智谱AI、字节跳动、阿里云、百度和科大讯飞等相继降低了大模型API调用价格,甚至部分提供免费服务。尽管技术能力是大模型的核心,但受制于算力等因素,中国大模型厂商不得不通过降低价格吸引用户和开发者,以推动大模型的落地应用。这种价格战虽然可能加剧市场竞争,但有助于加速大模型的普及和生态建设,实现技术与应用的共同发展。

13.利用AI、数字孪生和AR/VR进行军用飞机维护

先进技术如人工智能、数字孪生和增强/虚拟现实正在彻底改变传统的飞机维护和修理方法。航空航天和军工制造商越来越多地采用创新解决方案,以优化维护程序、增强安全协议并降低运营成本。AI驱动的预测性维护通过数据分析和机器学习算法,在故障发生前预测潜在问题,从而主动安排修理。数字孪生通过虚拟表示飞机的实际状态,使操作员能够优化维护活动和备件管理。AR/VR技术提供实时指导和沉浸式培训,提高了技术人员的效率和熟练程度。这些技术的应用将大大改善飞机维护和修理的流程,提高整体安全性和可靠性。

14.大模型赋能教育 深度融合AI路径

“教育+AI”创新应用论坛在中关村互联网教育创新中心举办,旨在探索人工智能与教育深度融合路径。北京市教育委员会信息化处处长吴雅星指出,教育数字化转型需全面融合AI,推动优质教育均衡发展。专家余胜泉强调,智能技术应促进个性化教育发展。海淀区教育科学研究院院长吴颖惠介绍了AI在教育中的具体应用,包括试点学校、教师培训和课程体系建设。各校代表分享了AI在教学中的实践和经验。圆桌论坛上,校长们探讨了AI在教育中的应用现状和挑战,并提出未来的创新方向。副区长武凯总结强调,AI技术是未来教育发展的关键,应加强教育科技人才一体化发展,推动教学创新,为区域经济社会发展注入新动能。

15.AI开发成本飙升 科技巨头垄断加剧

AI训练数据、模型规模、芯片和数据中心的需求急剧增加,推高了科技公司的成本。OpenAI与美国新闻集团签订了一项五年内金额超2.5亿美元的协议,用于AI训练。OpenAI CEO奥尔特曼表示,训练GPT-4的成本超1亿美元。英伟达的H100芯片售价约3万美元,Meta计划购买35万块。此外,云服务中心的建设成本也在增加。微软季度资本支出达140亿美元,谷歌母公司Alphabet为120亿美元,Meta预期支出达350亿至400亿美元。这些高额成本使得只有大型科技公司能在AI竞赛中竞争。欧美反垄断机构已开始关注这些科技巨头在AI领域的垄断地位。

16.AI训练需求暴增 面临数据短缺

随着AI大模型训练需求的增长,数据资源日益紧张。据Epoch AI预测,AI公司可能在2026年前耗尽高质量文本数据,而低质量数据可能在2030至2060年间枯竭。数据是AI发展的核心资源,训练数据越多,AI模型的能力越强。然而,随着需求增加,可用的公共数据资源变得稀缺。OpenAI的GPT-4训练量高达12万亿个数据点,GPT-5可能需要60万亿到100万亿个数据。高质量数据被视为AI训练的“金矿”,但也带来了版权问题。媒体和社交平台如CNN、《纽约时报》等已采取措施防止数据被滥用。OpenAI正在与媒体和社交平台达成合作协议,以解决版权争议。此外,部分公司使用自身数据训练AI,但这可能存在隐私泄露风险。还有公司尝试使用合成数据,但偏差问题可能导致AI模型崩溃。

关注「阿杰与AI」公众号

与AI时代更靠近一点