马斯克插队拿显卡事件 为了加速xAI产品研发,马斯克决定以10.8亿美元的价格提前预购英伟达明年1月才交付的GB200芯片,这一行为被视为插队拿显卡。尽管官方未正面回应这一传闻,但马斯克给相关推文点赞的行为几乎确认了此事。
GB200芯片性能相当强劲,其性能相当于5倍H100GPU,每颗芯片售价高达7万美元。网友根据交易金额和芯片单价估计,马斯克可能打算购买约10万个GPU,其意图被认为是超越OpenAI。
GB200芯片采用英伟达下一代Blackwell架构,运用台积电最先进的CoWoS - L封装技术,并整合高度复杂机柜设计。组装版GB200NVL72更是将训练速度提高了30倍,不过它的功耗相当高,需要700W到1200W的功率。由于设计复杂,GB200芯片的量产计划一再受阻,最近一次问题出现在背板连接设计上,导致量产时间可能推迟至2025年3月。
虽然生产还在爬坡,但巨头们仍抢先订购GB200。马斯克凭借与黄仁勋的私人关系也赶上了这次机会。这一订单对xAI意义重大,据悉,xAI预计最早本月推出一款面向消费者的AI应用,与ChatGPT展开竞争,并且正在训练一个新前沿模型,预计将在同一时间发布。虽然目前尚不清楚新的应用是否会使用新模型,但这些行动表明,马斯克需要大量算力资源来追赶OpenAI,而GB200芯片能为其提供强大的算力支持。
从行业影响来看,微软在得知GB200芯片量产可能推迟后,迅速做出反应,宣布削减40%的GB200订单,并将部分订单转投至预计明年中期发布的GB300芯片。而马斯克的这笔订单可能成为英伟达加速GB200芯片量产进程的强大催化剂,也彰显了英伟达芯片在市场上的非凡影响力与受欢迎程度。同时,考虑到马斯克在特斯拉与xAI之间的多重身份,这笔交易或将为特斯拉带来前所未有的机遇,使其在产品上更好地利用H100GPU,进而推动电动车智能系统的飞跃式发展。
xAI的野心 一、在人工智能技术探索方面的野心 xAI的设立宗旨为“了解宇宙的真实本质”,旨在推动人工智能技术的前沿发展。其团队成员汇聚了来自DeepMind、OpenAI、谷歌研究院、微软研究院、特斯拉、多伦多大学等知名机构的成员,这些成员都曾参与过诸如DeepMind的AlphaCode和OpenAI的GPT - 3.5和GPT - 4聊天机器人等项目的研发工作,从人员构成上就显示出其在人工智能技术探索方面的宏大目标。
二、在模型研发与竞争方面的野心 xAI在短短1年多时间里,仅Grok模型就从1→1.5→2,基本隔两三个月就会升级迭代,不断提升模型的性能和能力。并且,xAI正在建造一台超级计算机,计划连接10万块英伟达H100GPU,为下一代Grok模型提供算力支持,目标是打造世界上最强大的训练集群,希望新模型能在每个指标上被评为世界上最强大的AI,从而与ChatGPT背后的开发商OpenAI,以及Bard背后的开发商谷歌在人工智能领域展开竞争。
三、在商业运作与估值方面的野心 xAI在商业运作方面有着积极的进展和野心。在5月完成了新一轮60亿美元的融资,融资规模仅次于OpenAI,推高公司估值至240亿美元。据《纽约邮报》11月1日报道,xAI希望筹集数十亿美元,使公司估值达到约400亿美元,并且预计在1月将进行一轮大规模融资,届时xAI的估值可能高达750亿美元。
四、在算力资源获取方面的野心 为了满足自身的发展需求,xAI不断寻求强大的算力资源。之前与甲骨文签订了关于24000块英伟达H100芯片的协议,并基于此展开了第二代大语言模型Grok - 2的训练,目前Grok - 2仍在进行微调和错误修复,预计将在下个月正式推出。2024年9月,xAI推出了其Colossus100kH100训练集群,10月28日英伟达宣布,xAI位于田纳西州孟菲斯市的Colossus超级计算机集群达到了10万颗NVIDIAHopperGPU的巨大规模,目前正被用于训练xAI的Grok系列大语言模型,以及作为XPremium用户功能之一的聊天机器人,并且几个月后其规模将翻倍至200k(50kH200x),这些都显示出xAI在获取算力资源方面的巨大野心。
从上述多个方面来看,xAI无论是在技术探索、模型研发、商业运作还是算力资源获取上,都展现出了极大的野心,试图在人工智能领域占据重要的一席之地。