谷歌TPU芯片如何挑战AI芯片主导地位本文探讨了谷歌定制化AI芯片TPU的技术特性，将其与传统GPU进行对比，分析了其在

谷歌定制化AI芯片（即张量处理器）正通过其专业化架构挑战现有市场格局。据报道，多家大型科技公司正计划斥资数十亿美元采购谷歌的张量处理器，这可能动摇英伟达作为AI芯片主要供应商的地位。

什么是TPU？

人工智能行业的成功在很大程度上依赖于图形处理单元。这是一种能够同时执行大量并行计算的计算机芯片，不同于大多数计算机中使用的逐个处理计算的中央处理单元。

意大利博洛尼亚大学的弗朗西斯科·孔蒂表示，图形处理单元最初是为了辅助计算机图形和游戏而开发的。这种并行计算的能力恰好适用于训练和运行人工智能模型，这些模型通常涉及同时处理大量数字网格的计算，即矩阵乘法。孔蒂说：“图形处理单元是一种非常通用的架构，它们极其适合高度并行的应用。”

然而，由于图形处理单元最初并非为人工智能而设计，它们在处理芯片上执行的计算时可能存在效率低下的问题。孔蒂介绍，张量处理器最初由谷歌在2016年开发，其设计完全围绕矩阵乘法展开，而这正是训练和运行大型人工智能模型所需的主要计算。

今年，谷歌发布了其第七代张量处理器，名为Ironwood，它为公司的许多人工智能模型提供动力。

TPU比GPU更适合AI吗？

英国布里斯托大学的西蒙·麦金托什-史密斯表示，从技术上讲，张量处理器更像是图形处理单元的一个子集，而非一种完全不同的芯片。他指出，因为张量处理器是针对特定人工智能应用而设计的，所以在这类任务中效率更高，可能节省数千万甚至数亿美元。

然而，孔蒂表示，这种专用化也有其缺点。如果不同代际之间的人工智能模型发生重大变化，张量处理器可能缺乏灵活性。他说：“如果你的张量处理器缺乏灵活性，你就必须在数据中心的中央处理器上进行计算，这会极大拖慢速度。”

孔蒂指出，英伟达图形处理单元的一个传统优势是，有简单易用的软件可以帮助人工智能设计者在英伟达芯片上运行代码。张量处理器刚问世时并不具备这种便利性，但现在这些芯片已经发展到更易于使用的阶段。

谁在制造TPU？

尽管谷歌率先推出了张量处理器，但许多大型人工智能公司以及小型初创企业现在都已开始开发自己的专用张量处理器。例如，某机构使用自己的Trainium芯片来训练其人工智能模型。

麦金托什-史密斯表示：“大多数大型科技公司都有内部的芯片开发项目，部分原因是图形处理单元因供不应求而变得非常昂贵，自己设计和制造可能更便宜。”

TPU将如何影响AI行业？

谷歌开发其张量处理器已超过十年，但此前主要将这些芯片用于自身的人工智能模型。现在，情况似乎正在发生变化，其他大型公司正在大量采购谷歌张量处理器的计算能力。

麦金托什-史密斯认为，除了为大型公司提供更多选择外，多样化采购从财务角度也很有意义。他说：“这甚至可能意味着，未来你能从英伟达那里获得更好的交易。”FINISHED