当AI大模型席卷全球,算力成为数字时代的核心生产力,作为算力底座的GPU早已不止服务游戏,更是人工智能、科学计算、工业仿真的关键基石。长期以来,英伟达凭借技术与生态双重壁垒牢牢主导全球市场,CUDA闭源生态更是筑起难以逾越的护城河。面对外部技术封锁与国内算力刚需,国产GPU的突围之路,正从单纯硬件追赶转向开源生态与自主指令集并行的全新赛道。
GPU与AI的深度绑定绝非偶然,其核心优势是并行计算,擅长处理海量重复的矩阵向量运算,与图形渲染、AI训练底层逻辑高度契合。1999年英伟达推出GeForce 256定义GPU,2012年AlexNet用两张显卡完胜上万CPU,彻底奠定其AI算力统治地位。真正筑牢垄断壁垒的是CUDA平台,近二十年积累形成覆盖框架、模型、工具链的完整生态,主流开发框架与开源模型均基于其优化,开发者切换平台面临极高迁移成本,加之英伟达闭源指令集与底层IP管控,国产GPU早期追赶步履维艰,直到外部禁令倒逼、开源技术成熟,才迎来结构性机遇。
打破英伟达垄断不能走单纯对标复刻的老路,构建开放、可控、低成本的底层技术体系才是关键,OpenCL与RISC-V的组合正是破局密钥。OpenCL作为跨平台并行编程标准,不绑定单一厂商,兼容CPU、GPU、FPGA等多类算力设备,开源开放的特性大幅降低代码迁移成本,既能破解生态绑定难题,也是国产GPU打通软件生态的最优选择。而RISC-V开源指令集,则为国产GPU提供了自主底层支撑,相比闭源指令集,它免费开源、模块化可扩展,既能规避海外专利风险,又能定制化适配GPU并行需求,快速聚拢生态资源,破解“硬件易突破、生态难跟进”的困境。二者上下协同,让国产GPU摆脱海外闭源依赖,走出开源共建的差异化路线。
在这条技术赛道上,清华大学集成电路学院研发的乘影(Ventus)GPGPU,成为国产开源通用GPU的标杆成果,也是全球首款基于RISC-V向量扩展架构的开源GPGPU。乘影以RISC-V向量扩展为核心,采用SIMT架构适配并行计算特性,搭配OpenCL框架搭建全栈工具链,实现跨设备兼容运行。作为清华首个全球开源科技项目,它全面开放架构文档与代码,降低企业二次开发门槛,既完成了FPGA原型验证,兼顾科研价值与商用可行性,又填补了国产开源GPGPU空白,让OpenCL+RISC-V路线从理念落地为实践。
高校科研突破与商业厂商发力形成互补,国产GPU正构建多元算力底座。华为昇腾、寒武纪、壁仞聚焦AI专用芯片,性能逐步逼近海外同类产品;摩尔线程则深耕全功能GPU赛道,覆盖图形渲染、AI计算、科学计算全场景,不仅推出游戏显卡与服务器级显卡,还打造对标CUDA的MUSA架构,兼容OpenCL标准,更攻克千卡集群难题,其夸父智算集群加速比优异,已与多家头部大模型厂商达成合作。
不可否认,国产GPU在硬件性能、先进制程、生态成熟度上仍与英伟达存在差距,短期难以完全替代,但国内庞大市场、政策扶持与开源技术反哺,让国产算力拥有充足迭代底气。从商业厂商的硬件攻坚,到清华乘影的开源创新,从CUDA兼容到OpenCL+RISC-V自主生态搭建,国产GPU正以多元路线突围。算力自主是数字时代的必答题,随着技术迭代与生态完善,国产力量终将打破海外垄断,在全球算力格局中占据一席之地。
公众号:OpenSNN