欢迎关注我的公众号 [极智视界],获取我的更多经验分享
大家好,我是极智视界,本文来介绍一下 先进封装技术Chiplet。
邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接:t.zsxq.com/0aiNxERDq
芯片先进封装技术是个神秘且高科技的领域,最近开车上下班的路上听了一些先进封装技术的介绍,比较感兴趣,整理整理分享一起学习一下。对于 Chiplet,之前也经常听到,正好这次来讲讲到底是什么 Chiplet。要说 Chiplet,首先要了解芯片封装的概念。一般可以把芯片的封装大致划分为四个阶段:
- <1> 裸片贴装 => 代表的连接方式是引线键合;
- <2> 倒片封装 => 代表的连接方式是焊球或者凸点;
- <3> 晶圆级封装 => 代表的连接方式是 RDL 重布线层技术;
- <4> 2.5D/3D封装 => 代表的连接方式是 TSV硅通孔技术 & Chiplet封装技术;
所以可以看到,Cliplet 封装是在 2.5D/3D 封装这个阶段的,也是基于 TSV硅通孔技术的。在 AI 时代,高算力对芯片的传输速度、信息密度有着非常高的需求,为了不让封装拖了芯片的后退,工程师们在设计芯片的时候,在设计如何提高连接密度、提高传输速度方面想尽方法,并且还要考虑连接质量、降低生产成本、降低功耗等。
2.5D 封装是指把多块芯片安装在同一块硅中介层上,再把硅中介层安装到 PCB 基板上,然后再把它们整体封装到一起,形成一块完整的集成芯片。这个硅中介层可以理解为一块精密的电路芯片,里面布置了密集的电信号传输通道,芯片之间通过这个硅中介层形成非常高密度的信息连接,从而减少了信号传输的延迟和功耗。由于加上了这块硅中介层,所以这个封装方法称为 2.5D封装,就像下图中的左边部分示意。再来说 3D封装,在 2.5D封装的基础上,去掉硅中介层,直接把每块芯片堆叠到一起,这样的话传输路径会更短体积也会更加小。这其实就是 3D 封装,也就是下图中的右侧部分示意。3D 封装对工艺的要求更加苛刻,不过现在已经越来越多的 CPU、GPU 和 存储芯片开始采用 3D 封装,比如海力士的 HBM 存储芯片,就是通过 3D 封装的堆叠来实现了更大的传输带宽。
要做到 2.5D / 3D 封装,最关键的技术就是硅通孔技术,也就是 TSV (Through Silicon Via)。由于每块芯片都有复杂的电路,芯片和芯片之间的连接 比 单纯的芯片和基板之间的连接要复杂的多。芯片设计工程师们想到的办法就是打孔,直接把芯片的焊点打穿,形成一个个通孔,然后在通孔里面填充金属材料,这样就把芯片一层一层串联起来了,就像搭积木一样。要如何在那么小的芯片上精准开孔,并且不损伤到芯片自身的电路,然后还要在通孔里面精准填充金属来实现键合,还要保证晶片不会发生翘曲和破裂,这个技术的难度非常高。整个工艺流程涉及到激光刻蚀、气相沉积、电镀等环节,精细程度已经是接近半导体晶圆制造环节了。
2.5D / 3D 封装技术把整个芯片系统的信息传输速度和传输密度,提高到了一个全新的高度。2011年,台积电首先推出了全球首个 2.5D 先进封装技术,也就是大名鼎鼎的 CoWoS 封装。它通过硅通孔技术,把逻辑、计算和存储多个芯片集成在一起,目前最顶级的算力芯片英伟达 H100 就是采用了这个工艺。
TSV 硅通孔技术还有一种巧妙的运用,那就是 Chiplet 封装,讲了这么多终于要到 Chiplet 了,开不开心、激不激动。Chiplet 封装解决的不是进一步提高连接密度的问题,而是如何在保证连接密度的情况下,减少芯片制造的难度。目前电路集成化有两种路径,一种是传统的几个独立的芯片一起焊在同一块电路上,这个叫做系统级封装 SIP (System in a Package);另一种是更加高级的,直接把不同功能的元器件,做成一颗高度集成的芯片,这个叫做系统级芯片 Soc (System on a Chip),它的信息传输效率更加高、体积更加小,但是开发成本和工艺难度更大。对于 Soc 的高开发难度,Chiplet 技术提供了一种全新的解法。Chiplet 的意思就是小芯片或者芯粒,它是把一块 Soc 芯片拆解成了多个小芯片,这些小芯片通过 TSV 技术和硅中介层连接,它们之间的信号传输速率和一块完整的 Soc 芯片几乎是接近的。Chiplet 的示意图如下,
Chiplet 这样做的好处有哪些呢?首先是成本大幅下降,大面积的单颗 Soc 良率很低,而小芯片的制程工艺相对成熟,良率会高很多,这样就把晶圆制造的成本降下来了;接着是大幅下降技术门槛,Soc 芯片的开发周期长设计难度高,而 Chiplet 只需要分开设计各个功能模块的小芯片,难度大幅降低,可以加速芯片迭代升级的速度;然后是灵活度更高,同一块 Soc 芯片的各个功能模块的纳米制程都是一样的,比如统一为 7nm,而 Chiplet 可以兼容多种工艺制程,比如 CPU 芯片可以是 5nm 的、而存储芯片可以用 14nm 的。Soc 芯片只要一个功能区域坏了,整个芯片也就坏了,而 Chiplet 封装芯片,如果一个功能区坏了,只需要把相应的模块替换掉就行了。甚至还可以自定义升级想要升级的功能模块,比如想把存储芯片换成容量更加大的。
在 2017 年,AMD 推出了第一代霄龙 (EPYC) 处理器 Naples,如下,它把四个相同类型的 CPU 通过 Chiplet 方案封装在一起。虽然它比传统的单一一块处理器芯片多出了 10% 的面积,但是整体节约了 41% 的成本。在性能上可以对标当时英特尔的白金至强处理器。
2023 年,AMD 发布了 AI 加速卡 MI300,也采用了 Chiplet 技术,性能能够对标当前英伟达最强的 H100 芯片。如果不考虑体积的话,Chiplet 芯片在性能上是可以做到和 Soc 芯片旗鼓相当的。
说到这里就比较有意思了,如果我的半导体制程工艺不够先进,那么我是不是可以 Chiplet 技术,达到和高端工艺同样的效果呢?这也是为什么在目前国内先进制程技术封锁的情况下,Chiplet 研究这么火热的原因了。Chiplet 这个技术,将大面积芯片在制作环节的难度和成本转嫁到了封装环节,而封装环节正是我们国内在半导体领域最擅长的。
在今年大模型所带来的 AI 热潮中,各大厂商纷纷布局研发 AI 大模型,算力逐渐成为 AI 中最倚重、最核心的资源。而当今最强算力就是英伟达的 A100 显卡和 H100 显卡,H100 因为英伟达的产能不足和美国的限制出口禁令导致一卡难求。算力芯片被卡了脖子,我们就一筹莫展吗?答案肯定是否。如果我们国产可以勉强做出还行的算力芯片,然后靠数量去堆叠,也可能达到人家那样的效果。而 Chiplet 或许就是这个破局的关键。
好了,以上分享了 先进封装技术Chiplet,希望我的分享能对你的学习有一点帮助。
【公众号传送】
畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球, 星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。不敢说会对你学习有所帮助,但一定非常好玩,并持续更新更加有趣的项目。 t.zsxq.com/0aiNxERDq