新闻摘要
1.GPT-5明年底推出
2.苹果探索与Meta的AI合作
3.科技巨头微软押注核能破解AI耗电困局
4.华为音乐与科大讯飞达成全面深度合作
5.英伟达将为卡塔尔电信公司Ooredoo提供人工智能技术
6.黄仁勋六个交易日出售价值逾9000万美元英伟达股票
7.GPT-5一年半后拥有“博士级智能”,Claude 3.5首超人类博士
8.苹果Siri接入GPT,华为小艺靠盘古大模型迎战
9.OpenAI完成收购数据库分析公司Rockset
10.OpenAI程序员薪资曝光:高薪待遇令人垂涎
11.快手可灵大模型新功能升级
12.起底可灵背后原理:扩散模型结合Transformer助力视频生成
13.朱啸虎:五年后大模型公司难以独立存在,核心在寻找尖刀式场景
14.4月中国汽车保值率出炉,比亚迪多款新能源车上榜
15.《矿山产业集群大模型运营最佳实践》白皮书发布,助力矿业数智化转型
16.“人工智能+”带来新变化
17.华为开发者大会举办,关注鸿蒙AI生态,国产人形机器人有望加速
扫码加入交流群
获得更多技术支持和交流
(请注明自己的职业)
1.GPT-5明年底推出
业界先前传闻OpenAI会在去年推出新一代AI模型GPT-5,但今年已过半仍未见踪影。OpenAI执行长萨姆·奥特曼(Sam Altman)近日强调,GPT-5没有预定推出时程。技术长米拉·穆拉蒂(Mira Murati)表示,GPT-5将在2025年底或2026年初推出。自2022年底OpenAI推出ChatGPT以来,全球掀起生成式AI革命,科技大厂如谷歌、Meta和亚马逊纷纷投入AI模型研发,给OpenAI带来竞争压力。虽然OpenAI推出了GPT-4及GPT-4o等模型,但GPT-5的发布被推迟。GPT-5内部代号为「Gobi」及「Arrakis」,是多模态AI模型,拥有52兆个参数。穆拉蒂表示,GPT-4到GPT-5的技术演进相当于从高中到大学的跨越,甚至能展现博士程度的解决能力。尽管微软技术长凯文·斯科特(Kevin Scott)曾表示,GPT-5自去年12月开始训练,有望在今年美国总统大选后上线,但OpenAI近日表示推出时程将延后。奥特曼在接受专访时强调,OpenAI未设定GPT-5的推出时程,未来推出时名称也可能不是GPT-5,OpenAI在研发新一代AI模型时坚守品质至上的原则,不想赶鸭子上架。
2.苹果探索与Meta的AI合作
据《华尔街日报》报道,苹果正在探索与Meta的人工智能合作,Meta将其AI能力整合到苹果的内部AI项目Apple Intelligence中。尽管两家公司曾因苹果的隐私政策变化产生分歧,Meta声称该政策导致其2022年收入减少100亿美元,但双方在AI技术上可能找到共同点。除了与Meta和OpenAI的合作外,苹果还在与谷歌以及初创公司Anthropic和Perplexity进行AI整合合作。
3.科技巨头微软押注核能破解AI耗电困局
微软创始人比尔·盖茨近日透露将继续对美国怀俄明州的“下一代”核电站投资数十亿美元,以应对AI崛起引发的电力需求飙升。国际能源署数据显示,使用ChatGPT进行一次查询消耗2.9瓦时电量,比普通引擎搜索高出近10倍。到2026年,AI和加密货币数据中心的年电力消耗量可能翻倍,达到1000太瓦时(TWh)。为应对AI的高能耗,谷歌、微软和亚马逊等科技巨头纷纷押注核能,签署电力购买协议或投资核电站。然而,目前尚无任何小型模块化反应堆(SMR)技术可立即部署,许多核技术初创企业的商业运营时间表指向2030年之后。
4.华为音乐与科大讯飞达成全面深度合作
2024年6月22日,在华为开发者大会2024(HDC 2024)期间,华为音乐与科大讯飞在东莞签署了全面深度合作协议。双方将基于HarmonyOS发展全场景时代的新生态,在音乐内容发行、艺人合作、手机铃音AI创作等方面展开深入合作,提升鸿蒙生态的娱乐能力,为用户提供更加智能、便捷的视听体验。华为互动媒体军团CEO吴昊表示,双方将利用HarmonyOS的元服务能力和华为软硬件协同优势,共同创作空间音频作品。科大讯飞AI文娱业务群副总裁郭嘉指出,双方将通过音乐版权合作和多领域IP搭载鸿蒙生态进行创新活动,并通过线下演绎活动让内容走近华为用户。华为音乐将继续与全球唱片公司合作,提供丰富的高品质音乐服务,覆盖HarmonyOS多终端全场景。
5.英伟达将为卡塔尔电信公司Ooredoo提供人工智能技术
据彭博社报道,英伟达与总部位于卡塔尔多哈的电信公司Ooredoo签署了一项协议,将在Ooredoo位于卡塔尔、阿尔及利亚、突尼斯、阿曼、科威特和马尔代夫的数据中心部署其人工智能技术。这使Ooredoo成为该地区首家能够让客户直接访问英伟达人工智能和图形处理技术的公司。两家公司未透露交易的具体价值。
6.黄仁勋六个交易日出售价值逾9000万美元英伟达股票
根据英伟达提交给美国SEC的文件,英伟达CEO黄仁勋在6月13日至6月21日期间(6月19日休市)出售了72万股英伟达股票,套现9464万美元。目前,黄仁勋仍直接或通过信托间接持有超过8.66亿股英伟达股票。
7.GPT-5一年半后拥有“博士级智能”,Claude 3.5首超人类博士
OpenAI CTO Murati表示,GPT-5将在一年半后发布,达到博士水平智能;而Claude 3.5 Sonnet已经在测试分数上超过最聪明的人类博士。GPT-3相当于幼儿智能,GPT-4相当于聪明的高中生,GPT-5将在18个月后发布,具备博士级智能。Claude 3.5在研究生级推理、本科级知识和编码能力测试中刷新纪录,首次突破GPQA 65%的分数,超过最聪明的人类博士。随着AI发展,Murati预测未来AI会像人类一样合作,AGI可能在2027年实现,逐步走向超级智能(ASI)。ASI可能被视为“新神”,在人类社会中获得类似神的权威和影响力。论文指出,ASI的崇拜现象可能导致技术神权,削弱人类的批判性思维。作者提醒,应保持批判性思维,避免完全依赖AI决策。
8.苹果Siri接入GPT,华为小艺靠盘古大模型迎战
在华为开发者大会2024上,华为介绍了智能语音助手小艺接入盘古大模型后的表现,可进行更自然的语音交互和应用协作,类似即将更新的苹果Siri。苹果在WWDC开发者大会上推出Apple Intelligence套件,深度整合AI功能,并与OpenAI合作,允许用户免费使用ChatGPT。华为发布盘古大模型5.0,支持小艺在多任务场景下应用。小艺功能包括识别处理文字和图片、一键生成表格、创建日程等,并可在不同应用间协作。苹果Siri新功能也包括多模态能力和应用间协作。两者通过大模型支持端侧AI应用,避免数据上传至外部服务器的隐私泄露隐患。目前手机厂商还在探索端侧AI应用。vivo发布蓝心大模型,荣耀搭载70亿参数的“魔法大模型”,小米的大语言模型MiLM逐步应用于多领域。据Canalys预测,今年AI手机出货量占全球智能手机出货量的16%,2028年将达到54%。
9.OpenAI完成收购数据库分析公司Rockset
6月23日,OpenAI宣布完成对数据库分析公司Rockset的收购。Rockset是一家实时索引数据库公司,其独特的Converged Index™技术能够对结构化、半结构化、地理和时间序列数据进行大规模高性能搜索和分析。Rockset支持对半结构化数据进行实时SQL查询,允许开发人员灵活地快速搜索、聚合和合并来自任何来源的各种数据类型。此次收购将进一步增强OpenAI的数据处理和分析能力,推动其在人工智能领域的应用和发展。
10.OpenAI程序员薪资曝光:高薪待遇令人垂涎
OpenAI,也就是大家熟知的ChatGPT的开创公司,现已在全球范围内占据领先地位,是许多AI从业者非常崇拜的公司。根据调查,OpenAI的软开岗位薪酬起步价为140万元人民币,并且允许部分时间居家办公。这种高薪待遇让人垂涎三尺。OpenAI的主管工程师薪酬中位数高达92.5万美元(约660万人民币),开发岗位大佬拥有10年经验的软件工程师的薪资构成包括30万美元的固定工资和62.5万美元的股权激励。
11.快手可灵大模型新功能升级
6月21日,快手可灵大模型推出图生视频和视频续写两项新功能。图生视频可将静态图像转化为5秒动态视频,并支持添加提示词控制图像运动。例如,上传蒙娜丽莎图像,可灵能让她戴上墨镜并进行眼神交流。视频续写功能则允许对已生成的视频进行一键续写,每次续写生成约5秒内容,通过多次续写可达3分钟。新功能的亮点是集成了文本控制机制,用户可通过自定义提示词扩展视频内容。官方举例称,可控制古堡视频片段的日夜变换及灯光效果。
12.起底可灵背后原理:扩散模型结合Transformer助力视频生成
近日,中国短视频平台快手发布了首个文本到视频的生成式人工智能模型“可灵大模型”(Kling),可生成长达两分钟、帧率为每秒30帧、分辨率高达1080p的视频。这一模型与OpenAI的Sora模型类似,将扩散模型与Transformer架构结合,使其能够处理更大的视频数据文件并有效生成结果。可灵模型的工作方式类似于Sora,通过结合扩散模型和Transformer架构,实现了对视频生成的高效处理。快手的庞大视频平台为可灵提供了丰富的训练数据,尽管快手表示其模型训练使用了全球互联网上公开的数据,但具体细节未披露。目前,可灵在实用性上的最大限制是只能生成5秒长的视频,适合短视频行业的需求。随着技术的进步,未来可能会对短视频创作规则产生重大影响,甚至可能减少平台对网红创作者的依赖。总之,随着可灵及其他类似模型的发布,文本到视频工具领域将更加活跃,对短视频创作和行业发展产生深远影响。
13.朱啸虎:五年后大模型公司难以独立存在,核心在寻找尖刀式场景
6月21日,金沙江创投合伙人朱啸虎在“创投十年”高峰论坛上发表了主题为“扬鞭奋蹄正当时”的演讲,分享了他对创投行业新形势和新变化的见解。朱啸虎认为,目前是投资的最好时机点,生成式AI将是一个以十年为单位的长周期机会。如果大模型迭代速度放缓,应用创新的机会将增多。他预计五年后不会再有独立的大模型公司存在,只有AI应用公司或云服务公司。在中国,AI的核心不是技术,而是用户体验。创业者应专注于垂直场景,找到能引起客户尖叫的应用场景,而不是在底层技术上投入过多。他强调,做AI并不需要大量资金或算力,而是要聚焦垂直应用,寻找具有实用价值的场景。
14.4月中国汽车保值率出炉,比亚迪多款新能源车上榜
近日,中国汽车流通协会和精真估发布了《2023年4月中国汽车保值率研究报告》。报告显示,比亚迪多款插电混动车型如宋Pro DM-i、宋PLUS DM-i、汉DM-i、驱逐舰05等进入榜单,表现出色。非国产车型主要集中在进口版本。新能源汽车保值率受降价促销影响较大,自主品牌如长安、荣威、奇瑞等在逆境中表现出较强的抗压能力。豪华品牌如保时捷和特斯拉保值率大幅下降,分别为83.1%和54.4%。相较之下,丰田和本田保值率仍较高,分别为70.1%和67.4%。在纯电动车榜单中,科莱威CLEVER、比亚迪海豚和保时捷Taycan名列前三。比亚迪的海豚、宋PLUS EV、汉EV、元PLUS等车型也榜上有名,表现抢眼。
15.《矿山产业集群大模型运营最佳实践》白皮书发布,助力矿业数智化转型
6月22日,华为开发者大会2024期间,鄂尔多斯市数字投资有限公司与华为云联合发布《矿山产业集群大模型运营最佳实践》白皮书。该白皮书总结了平台运营过程中的实践经验,为矿业数智化转型提供参考。发布会上,鄂尔多斯市创新投资集团有限公司副总经理廉咏梅发表了主题演讲,介绍了基于华为云Stack和盘古矿山大模型的鄂尔多斯工业互联网平台。该平台已实现300多家煤企统一接入,提供AI算力和创新平台,推动煤矿产业智能化发展。华为云Stack大模型混合云已广泛应用于政府、金融、煤矿等多个行业,并将继续深入行业场景,与合作伙伴共迎AI黄金时代。
16.“人工智能+”带来新变化
以生成式人工智能(AIGC)为代表的新一代人工智能技术快速发展,商业应用成果不断涌现,广泛应用于各行业,深度赋能实体经济,提升效率并助力减排。OrcaAI的报告显示,AI在航运业中应用可每年减少4700万吨碳排放,节省燃料成本。微软的研究显示,全球75%的受访者已将AI融入日常工作,中国市场更高达91%。微软、麦当劳和初创公司月之暗面等企业纷纷推出AI应用,推动行业发展。然而,AIGC也可能引发失业和不平等问题,需提升劳动者的AI技能。总体而言,AIGC将成为各行业的新生产力。
17.华为开发者大会举办,关注鸿蒙AI生态,国产人形机器人有望加速
6月21日,华为开发者大会上发布的HarmonyOS NEXT和盘古大模型5.0显著提升性能与AI功能,推动鸿蒙系统生态和具身智能应用的发展。HarmonyOS NEXT将搭载于华为Mate70系列,打破安卓和IOS的垄断,实现系统和生态的国产化。盘古大模型在多个行业落地,推动国产AI终端和人形机器人发展。乐聚机器人搭载盘古大模型,展示在工业和家庭场景中的应用。相关领域如AI新基建、消费电子和工业控制等将显著受益。投资标的包括中微公司、赛腾股份、华中数控等。风险提示包括国产软件生态和AI终端设备商业化进度不及预期。
关注「阿杰与AI」公众号
与AI时代更靠近一点