如果说过去三年是大模型狂飙的“造梦期”,现在的AI产业,正在经历一场亢奋与痛苦并存的“落地大考”。
当企业满怀期待地将AI融入生产线时,却发现动辄千万级的投资依然填不满万亿参数的“算力饥渴”、底层硬件与开发框架间仿佛隔着难以逾越的壁垒、实验室里跑通的流程在产线上频频宕机……
越来越多企业意识到,以往暴力堆叠服务器、随便套用开源框架等“头痛医头、脚痛医脚”式的补救方案,在行业核心业务应用面前彻底失效了。既然缝缝补补的捷径走不通,有效的破局点又在哪呢?
日前结束的第四届北京人工智能产业创新发展大会,以“融合、效能、安全——让AI’+’出新活力”的主题,精准切中了当下的行业痛点。
其中在“融合·共创:产业巨擘谈AI+”议题环节,华为公司副总裁、中国政企业务总裁吴辉在圆桌对话中系统阐述了华为对中国AI算力未来的核心判断,以及从“单点突破”转向“系统效能”的路径。
透过吴辉在对话中的观点,不难提炼出AI融入千行百业的路线图。
01 融合创新,用“系统工程”打破天花板
让我们先回到原点,正视一个跳不过的行业症结。
为了喂饱动辄千亿参数的大模型,工程师们不得不绞尽脑汁提升算力密度,把成百上千乃至上万台服务器塞进机房。当通信频次随模型层数指数级增长,微秒级的延迟在万亿次迭代中不断累积,让计算单元长时间处于等待状态,导致算力利用率低下且运维成本猛增。
盲目堆砌算力,已然无法根治“算力饥渴”。
吴辉在演讲中一针见血地指出:“一个芯片固然很重要,但人工智能是一个产业,也是一种新质生产力,算力更是一个系统。”华为的解题思路是“以系统性创新突破单芯片局限,用数学补物理、非摩尔补摩尔,打造创新的超节点架构,实现规模算力的全球领先。”
直接的例子就是由8192张昇腾卡打造的Atlas 950 SuperPoD超节点,凭借内存统一编址等优势,能够像一台计算机一样高效工作,算力是业界主流水平的6.7倍,训练总吞吐提升17倍、推理总吞吐提升26.5倍,在未来多年都将是全球最强算力的超节点。
华为是怎么打破天花板的呢?答案正是吴辉提到的“系统性创新”。
在大规模AI训练与推理中,存在海量GB级的数据通信,想要提高算力利用率,通信带宽要足够宽、通信时延要足够低、内存访问要足够快,任何一处的瓶颈,都会导致计算与通信相互等待。
华为的超节点架构,创造性地解决了两大挑战。
一是将传统以CPU为中心的架构,变成了全对等互联,CPU、NPU/GPU等设备在统一的协议下互联互通,整合为统一的全局地址空间,不管数据存在哪块内存里,都只有一个“全局地址”,可以直接访问。
二是通信协议的创新,传输的不再是笨重的“数据包”,而是包含内存地址、操作码(读/写)和缓存状态位的“Flit”,极大地提升了通信效率,并通过缓存一致性协议确保所有计算单元看到的信息是相同的。
相较于传统的计算集群,华为的超节点架构实现了三个硬性指标,即大带宽、低时延、内存统一编址,让集群像一台计算机一样学习、思考和工作,从根本上解决了算力利用率低、运维复杂度高等问题。
从“单点突围”到“全局统筹”的跃变,揭示了AI时代的核心命题:在摩尔定律失效的当下,算力供给不再是比拼单卡性能的“加法游戏”,只有掌握系统级创新的“乘法法则”,用系统工程打破物理瓶颈,才是满足整个行业的算力刚需、迈向通用人工智能的必由之路。
02 生态共创,打造繁荣开放的“黑土地”
把算力比作AI时代的骨架,生态就是关乎长期生命力的血肉。
回顾计算产业的发展史,从不缺少性能耀眼的产品,最终决定牌局走向的,往往是生态。当前中国算力产业面临的真实困境在于:在制造和架构创新上已经能和国外掰手腕,软件生态一直摆脱不了外部依赖。
面对这道残酷的“生死题”,一些玩家试图“走捷径”。比如在CUDA的API和芯片的底层驱动间加一个“翻译器”,可CUDA并非开源,第三方产品很难通过指令翻译的方式实现完美兼容,还面临英伟达扎紧藩篱(禁止通过转译层运行软件等)的风险。
吴辉一语道出了AI产业的关键:“构建一个芯片和系统不是最难的,最重要的是构建一个大家共同使用和运用技术的开放生态。华为在计算领域始终坚定践行‘硬件开放、软件开源’战略。”
对应的行动有很多。
比如计算架构CANN的全面开源开放。
有别于CUDA的封闭,CANN将算子库、通信库、图引擎、编程语言、运行时等核心组件进行全量、分层解耦的开源。企业和高校的科研团队可以深入到图优化、算子融合、内存调度等底层机制进行二次创新,甚至不用局限于现成的工具和框架,可以根据自身需求进行深度定制和优化,实现更高的性能和效率。
再比如灵衢2.0协议的全面开放。
作为超节点架构的“灵魂”,华为在HC 2025上开放了灵衢2.0技术规范,包括开放超节点参考架构、开放超节点基础硬件、开源操作系统灵衢组件等等。底层技术协议和整套超节点技术的开放,意味着产业界可以基于技术规范自研相关产品或部件,自主设计基于灵衢的各种产品,实现真正意义上的AI算力自由。
原因并不难解释。
站在企业和开发者的立场上,焦虑的不只是“好用不好用”,还涉及到是否自主创新:倘若底层机制不透明,只能依赖官方文档,一旦业务出现性能瓶颈,往往无从下手;假如创新的节奏被单个平台主导,像能源、制造、交通等行业,可能因为某个算子制约整个行业的效率……
时间印证了华为的选择。
开源5年的OpenHarmony,汇聚了9200多名社区贡献者,贡献了1.3亿行代码;全面开源开放的CANN,不到半年就有1.3万开发者参与进来,创新开发了420多个高性能算子。
数据是生态最好的注脚,当千千万万的开发者不再是单纯的“使用者”,化身为生态的“架构师”与“贡献者”,自主创新的“黑土地”将越来越肥沃。
03 提升效能,AI落地的唯一检验标准
技术创新的原点,终归要回到产业的本质——生产力。
当前不少企业对AI的理解仍停留在表层,认为仅仅是一次IT系统的例行升级,或者是采购一套更聪明的软件工具——买几台服务器、接几个大模型的API,就能顺理成章地贴上“数智化”标签。
也就是说,在AI融入千行百业的过程中,不仅要提供充沛的算力、打造繁荣的生态,还需要成熟的经验和转型方法论。
在华为公司副总裁、中国政企业务总裁吴辉看来,“企业走向AI与业务的融合本身是一场变革,包括重构生产方式、生产关系以及商业模式等。因此,AI一定要跟企业的流程、组织、IT、数据以及业务场景深度结合,才能打造新质生产力,提升企业的效能。”
过去五年时间里,华为和伙伴协助3.3万多家企业完成了数智化转型,交出了一份份实打实的成绩单。
在港口行业,天津港与华为共同推进港口行业大模型PortGPT的研发和落地应用,实现了近百辆无人集卡的自动驾驶、岸桥远程操控和全流程的AI排产,港口运行效率提升了15%,正作为港口数智化的新标杆向海外复制。
在制造行业,华为在初期顶层设计时就参与了赛力斯超级工厂的建设,从网络基础、数字平台、应用场景到运营管理,打造了全链路智能化解决方案,助力赛力斯超级工厂实现AI与数据的双轮驱动,助其最快30秒就能下线一辆车。
隔行不隔理,华为深度参与3.3万多家企业数智化转型的经验,沉淀成了一套可复制的方法论。
譬如在怎么从0到1落地AI的问题上,华为基于实践经验总结了“三层五阶八步”方法论,把模糊的AI落地变成了清晰可执行的步骤,即从业务场景出发,沿着业务流程、组织,数据和应用指导业务如何一步步落地AI,让企业不用再摸黑试错,少走一些弯路。
让我们印象深刻的是,吴辉在对话中没有过多强调华为的经验和方法论,而是多次提到“效能”一词。
既是华为对自身软硬件能力和成熟方法论的笃定,也为陷入落地焦虑的企业开出了一剂清醒的药方:AI必须深入到业务场景,完成“技术演示”到“生产要素”的跨越,对企业的利润表、效率曲线产生可量化的影响,蜕变为看得见的“新质生产力”,而非为了AI而AI。
特别是在AI进入“落地大考”的2026年,势必会酝酿出各种各样的新概念、新产品、新方案,千万别被“名词式创新”带偏,唯有提升效能,才是检验AI落地价值的标准。
04 写在最后
正如吴辉在对话结尾所强调的:“AI时代,我们要有紧迫感,人工智能可能是人类最后一次技术革命,我们要夜以继日,全力以赴追赶世界领先;同时我们要能深入行业,深刻理解行业需求,协助企业把人工智能融到生产和业务中去,助力千行百业在智能时代走向世界领先。”
这场通往智能时代的“远征”,绝不是华为一家企业的独角戏,而是千行百业的集体答卷。
当华为通过创新的超节点架构夯实了算力底座,用“硬件开放、软件开源”的决心培育了生态沃土,用脚踏实地的态度跑通了AI落地的路径,谁先把AI融入生产一线,谁就能先吃到数智化转型的红利。