原文链接:hothardware.com/news/amd-pa…
自2014年以来,英特尔一直在谈论处理器FPGA,但AMD的专利实际上可能会导致......
尽管FPGA本身不如CPU强大,但FPGA可以出色地完成特定任务。无论是加速用作大规模数据中心服务的架构以提高AI性能,一位有能力的工程师手中的FPGA都可以减轻CPU的各种任务负担,并加快处理速度。过去六年来,英特尔一直在谈论将Xeons与FPGA集成的大型游戏,但是它并没有导致单一产品进入其阵容。不过,AMD的一项新专利可能意味着FPGA新手可能已经准备好自己制造一个。
10月,AMD宣布了收购Xilinx的计划,这是对数据中心的重大推动的一部分。周四,美国专利商标局(USPTO)发布了一项AMD专利,该专利将可编程执行单元与CPU集成在一起。AMD在其专利申请中提出了20项主张,但要点是,处理器可以包括一个或多个执行单元,可以对这些执行单元进行编程以处理不同类型的定制指令集。FPGA正是这样做的。在我们看到基于这种设计的产品之前可能要花点时间,因为要成为最近的EPYC泄漏中包含的CPU的一部分似乎还为时过早。
尽管AMD为其Zen 2和Zen 3处理器的小芯片设计掀起了波澜,但事实似乎并非如此。 实际上,AMD的FPGA专利中的可编程单元 实际上与处理器的浮点和整数执行单元共享寄存器,如果它们不在同一封装中,将很困难,或者至少非常慢。这种集成应该使开发人员可以轻松地将这些自定义指令编织到应用程序中,而CPU只会知道将这些指令传递到处理器FPGA上。这些可编程单元可以处理非典型数据类型,特别是用于加快AI训练和推理速度的FP16(或半精度)值。
在有多个可编程单元的情况下,每个单元可以用不同的专用指令集进行编程,因此处理器可以加速多个指令集,并且这些可编程EU可以即时进行重新编程。这个想法是,当处理器加载程序时,它还会加载一个位文件,该文件配置可编程执行单元以加速某些任务。CPU自己的解码和分派单元可以对可编程单元进行寻址,传递那些要处理的自定义指令。
多年来,AMD一直在努力以不同的方式来加快AI计算的速度。首先,该公司宣布并发布了Radeon Impact系列AI加速器,它们只是具有自定义驱动程序的大型无头Radeon图形处理器。该公司通过在2018年Radeon RX 5000系列发布之前推出其第一款7纳米GPU MI60来实现这一目标。在60倍以上的收购之后,Xilinx转向了通过FPGA专注于AI成为现实。很高兴看到公司的想法。