09 高级 CPU 设计(Advanced CPU Designs)

142 阅读4分钟

9. 高级CPU设计-Advanced CPU Designs_BiliBili_哔哩哔哩_bilibili

1. 简介

在第 09 集中,视频主要介绍了高级 CPU 设计,包括从早期机械计算机到现代 CPU 的发展历史,如何通过提高晶体管的切换时间来提升处理器速度,以及各种提升 CPU 性能的技术如缓存、指令流水线、乱序执行等。

2. CPU 性能提升的历史

2.1 早期的 CPU 提速方法

早期电子计算机主要通过减少晶体管的切换时间来提升处理器速度。晶体管构成了逻辑门、算术逻辑单元(ALU)以及其他组件,这种方法虽然有效,但最终会遇到瓶颈。

2.2 硬件层面的复杂操作

现代 CPU 通过设计专门的电路处理更复杂的操作,如图形操作、解码压缩视频和加密文档。这些专门电路使得处理器的 ALU 能执行更复杂的指令,从而提升整体性能。

2.3 指令集的发展

指令集随着时间的推移不断增加,从最初的英特尔 4004 的 46 条指令发展到现代处理器的数千条指令。这些指令集扩展了 CPU 的功能,同时也保持了对旧指令的兼容性。

3. 缓存的应用

3.1 缓存的引入

为了提高数据传输速度,解决 RAM 的延迟问题,现代 CPU 在设计中引入了缓存(cache)。缓存能在一个时钟周期内提供数据,从而避免 CPU 的空等,显著提升性能。

3.2 缓存命中与未命中

如果所需数据已存在缓存中,称为缓存命中(cache hit),否则则是缓存未命中(cache miss)。缓存还可作为临时存储空间,存放中间计算结果,提高长计算任务的效率。缓存的状态需要同步,以保证数据一致性,使用的标志位称为“脏位”(dirty bit)。

4. 指令流水线和乱序执行

4.1 指令流水线

指令流水线技术通过并行处理多个指令的不同阶段,提高了单个指令流的吞吐量。流水线的设计使得处理器能在每个时钟周期内完成一个指令,从而大幅提升性能。

指令流水线

4.2 乱序执行

为了进一步提高效率,高端处理器采用乱序执行方式,通过动态重新排序和分支预测来减少流水线停工时间。分支预测的准确率可以超过 90%,大大提升了执行效率。

5. 超标量处理器与多核处理器

5.1 超标量处理器

超标量处理器通过增加多个相同的 ALU,实现一个时钟周期内执行多个指令,进一步提升了吞吐量。

5.2 多核处理器

多核处理器在单个芯片中集成多个独立的处理单元,可以共同处理共享计算任务。多核配置如双核和四核处理器已广泛应用于现代计算设备中。

6. 高端计算:超级计算机

当多核心或多 CPU 计算能力仍不足时,人类会构建超级计算机。截止至视频发布,世界上最快的计算机是位于中国无锡国家超算中心的“神威·太湖之光”,它包含 40960 个 CPU,每个 CPU 有 256 个核心。总共超过 1000 万个核心,每秒可进行 9.3 亿亿次浮点数运算 (FLOPS)。

7. 总结

  • 早期的 CPU 提速主要通过减少晶体管切换时间来实现。
  • 现代 CPU 包含专门电路处理复杂操作,指令集不断扩展。
  • 缓存通过减少数据传输延迟显著提升了 CPU 性能。
  • 指令流水线和乱序执行技术提高了指令流的吞吐量。
  • 超标量处理器和多核处理器通过并行处理进一步提升性能。
  • 超级计算机集成大量处理器,完成大规模计算任务。