华为为何能将AI融入千行百业？算力领先、生态繁荣、方法论可复制如果说过去三年是大模型狂飙的“造梦期”，现在的AI产业，正

如果说过去三年是大模型狂飙的“造梦期”，现在的AI产业，正在经历一场亢奋与痛苦并存的“落地大考”。

当企业满怀期待地将AI融入生产线时，却发现动辄千万级的投资依然填不满万亿参数的“算力饥渴”、底层硬件与开发框架间仿佛隔着难以逾越的壁垒、实验室里跑通的流程在产线上频频宕机……

越来越多企业意识到，以往暴力堆叠服务器、随便套用开源框架等“头痛医头、脚痛医脚”式的补救方案，在行业核心业务应用面前彻底失效了。既然缝缝补补的捷径走不通，有效的破局点又在哪呢？

日前结束的第四届北京人工智能产业创新发展大会，以“融合、效能、安全——让AI’+’出新活力”的主题，精准切中了当下的行业痛点。

其中在“融合·共创：产业巨擘谈AI+”议题环节，华为公司副总裁、中国政企业务总裁吴辉在圆桌对话中系统阐述了华为对中国AI算力未来的核心判断，以及从“单点突破”转向“系统效能”的路径。

透过吴辉在对话中的观点，不难提炼出AI融入千行百业的路线图。

01 融合创新，用“系统工程”打破天花板

让我们先回到原点，正视一个跳不过的行业症结。

为了喂饱动辄千亿参数的大模型，工程师们不得不绞尽脑汁提升算力密度，把成百上千乃至上万台服务器塞进机房。当通信频次随模型层数指数级增长，微秒级的延迟在万亿次迭代中不断累积，让计算单元长时间处于等待状态，导致算力利用率低下且运维成本猛增。

盲目堆砌算力，已然无法根治“算力饥渴”。

吴辉在演讲中一针见血地指出：“一个芯片固然很重要，但人工智能是一个产业，也是一种新质生产力，算力更是一个系统。”华为的解题思路是“以系统性创新突破单芯片局限，用数学补物理、非摩尔补摩尔，打造创新的超节点架构，实现规模算力的全球领先。”

直接的例子就是由8192张昇腾卡打造的Atlas 950 SuperPoD超节点，凭借内存统一编址等优势，能够像一台计算机一样高效工作，算力是业界主流水平的6.7倍，训练总吞吐提升17倍、推理总吞吐提升26.5倍，在未来多年都将是全球最强算力的超节点。

华为是怎么打破天花板的呢？答案正是吴辉提到的“系统性创新”。

在大规模AI训练与推理中，存在海量GB级的数据通信，想要提高算力利用率，通信带宽要足够宽、通信时延要足够低、内存访问要足够快，任何一处的瓶颈，都会导致计算与通信相互等待。

华为的超节点架构，创造性地解决了两大挑战。

一是将传统以CPU为中心的架构，变成了全对等互联，CPU、NPU/GPU等设备在统一的协议下互联互通，整合为统一的全局地址空间，不管数据存在哪块内存里，都只有一个“全局地址”，可以直接访问。

二是通信协议的创新，传输的不再是笨重的“数据包”，而是包含内存地址、操作码（读/写）和缓存状态位的“Flit”，极大地提升了通信效率，并通过缓存一致性协议确保所有计算单元看到的信息是相同的。

相较于传统的计算集群，华为的超节点架构实现了三个硬性指标，即大带宽、低时延、内存统一编址，让集群像一台计算机一样学习、思考和工作，从根本上解决了算力利用率低、运维复杂度高等问题。

从“单点突围”到“全局统筹”的跃变，揭示了AI时代的核心命题：在摩尔定律失效的当下，算力供给不再是比拼单卡性能的“加法游戏”，只有掌握系统级创新的“乘法法则”，用系统工程打破物理瓶颈，才是满足整个行业的算力刚需、迈向通用人工智能的必由之路。

02 生态共创，打造繁荣开放的“黑土地”

把算力比作AI时代的骨架，生态就是关乎长期生命力的血肉。

回顾计算产业的发展史，从不缺少性能耀眼的产品，最终决定牌局走向的，往往是生态。当前中国算力产业面临的真实困境在于：在制造和架构创新上已经能和国外掰手腕，软件生态一直摆脱不了外部依赖。

面对这道残酷的“生死题”，一些玩家试图“走捷径”。比如在CUDA的API和芯片的底层驱动间加一个“翻译器”，可CUDA并非开源，第三方产品很难通过指令翻译的方式实现完美兼容，还面临英伟达扎紧藩篱（禁止通过转译层运行软件等）的风险。

吴辉一语道出了AI产业的关键：“构建一个芯片和系统不是最难的，最重要的是构建一个大家共同使用和运用技术的开放生态。华为在计算领域始终坚定践行‘硬件开放、软件开源’战略。”

对应的行动有很多。

比如计算架构CANN的全面开源开放。

有别于CUDA的封闭，CANN将算子库、通信库、图引擎、编程语言、运行时等核心组件进行全量、分层解耦的开源。企业和高校的科研团队可以深入到图优化、算子融合、内存调度等底层机制进行二次创新，甚至不用局限于现成的工具和框架，可以根据自身需求进行深度定制和优化，实现更高的性能和效率。

再比如灵衢2.0协议的全面开放。

作为超节点架构的“灵魂”，华为在HC 2025上开放了灵衢2.0技术规范，包括开放超节点参考架构、开放超节点基础硬件、开源操作系统灵衢组件等等。底层技术协议和整套超节点技术的开放，意味着产业界可以基于技术规范自研相关产品或部件，自主设计基于灵衢的各种产品，实现真正意义上的AI算力自由。

原因并不难解释。

站在企业和开发者的立场上，焦虑的不只是“好用不好用”，还涉及到是否自主创新：倘若底层机制不透明，只能依赖官方文档，一旦业务出现性能瓶颈，往往无从下手；假如创新的节奏被单个平台主导，像能源、制造、交通等行业，可能因为某个算子制约整个行业的效率……

时间印证了华为的选择。

开源5年的OpenHarmony，汇聚了9200多名社区贡献者，贡献了1.3亿行代码；全面开源开放的CANN，不到半年就有1.3万开发者参与进来，创新开发了420多个高性能算子。

数据是生态最好的注脚，当千千万万的开发者不再是单纯的“使用者”，化身为生态的“架构师”与“贡献者”，自主创新的“黑土地”将越来越肥沃。

03 提升效能，AI落地的唯一检验标准

技术创新的原点，终归要回到产业的本质——生产力。

当前不少企业对AI的理解仍停留在表层，认为仅仅是一次IT系统的例行升级，或者是采购一套更聪明的软件工具——买几台服务器、接几个大模型的API，就能顺理成章地贴上“数智化”标签。

也就是说，在AI融入千行百业的过程中，不仅要提供充沛的算力、打造繁荣的生态，还需要成熟的经验和转型方法论。

在华为公司副总裁、中国政企业务总裁吴辉看来，“企业走向AI与业务的融合本身是一场变革，包括重构生产方式、生产关系以及商业模式等。因此，AI一定要跟企业的流程、组织、IT、数据以及业务场景深度结合，才能打造新质生产力，提升企业的效能。”

过去五年时间里，华为和伙伴协助3.3万多家企业完成了数智化转型，交出了一份份实打实的成绩单。

在港口行业，天津港与华为共同推进港口行业大模型PortGPT的研发和落地应用，实现了近百辆无人集卡的自动驾驶、岸桥远程操控和全流程的AI排产，港口运行效率提升了15%，正作为港口数智化的新标杆向海外复制。

在制造行业，华为在初期顶层设计时就参与了赛力斯超级工厂的建设，从网络基础、数字平台、应用场景到运营管理，打造了全链路智能化解决方案，助力赛力斯超级工厂实现AI与数据的双轮驱动，助其最快30秒就能下线一辆车。

隔行不隔理，华为深度参与3.3万多家企业数智化转型的经验，沉淀成了一套可复制的方法论。

譬如在怎么从0到1落地AI的问题上，华为基于实践经验总结了“三层五阶八步”方法论，把模糊的AI落地变成了清晰可执行的步骤，即从业务场景出发，沿着业务流程、组织，数据和应用指导业务如何一步步落地AI，让企业不用再摸黑试错，少走一些弯路。

让我们印象深刻的是，吴辉在对话中没有过多强调华为的经验和方法论，而是多次提到“效能”一词。

既是华为对自身软硬件能力和成熟方法论的笃定，也为陷入落地焦虑的企业开出了一剂清醒的药方：AI必须深入到业务场景，完成“技术演示”到“生产要素”的跨越，对企业的利润表、效率曲线产生可量化的影响，蜕变为看得见的“新质生产力”，而非为了AI而AI。

特别是在AI进入“落地大考”的2026年，势必会酝酿出各种各样的新概念、新产品、新方案，千万别被“名词式创新”带偏，唯有提升效能，才是检验AI落地价值的标准。

04 写在最后

正如吴辉在对话结尾所强调的：“AI时代，我们要有紧迫感，人工智能可能是人类最后一次技术革命，我们要夜以继日，全力以赴追赶世界领先；同时我们要能深入行业，深刻理解行业需求，协助企业把人工智能融到生产和业务中去，助力千行百业在智能时代走向世界领先。”

这场通往智能时代的“远征”，绝不是华为一家企业的独角戏，而是千行百业的集体答卷。

当华为通过创新的超节点架构夯实了算力底座，用“硬件开放、软件开源”的决心培育了生态沃土，用脚踏实地的态度跑通了AI落地的路径，谁先把AI融入生产一线，谁就能先吃到数智化转型的红利。