流水线技术把一个任务分解为若干顺序执行的子任务,不同的子任务由不同的执行机构负责执行,而这些机构可以同时并行工作。在任一时刻,任一任务只占用其中一个执行机构,这样就可以实现多个任务的重叠执行,以提高工作效率。
1、流水线周期
流水线应用过程中,会将需要处理的工作分为N个阶段,最耗时的那一段所消耗的时间为流水线周期。如:使用流水线技术执行100条指令,每条指令取指2ms,分析4ms,执行1ms,则流水线周期为4ms。
2、计算流水线执行时间
延续上面的场景,将1个任务的执行过程可分成N个阶段,假设每个阶段完成时间为t,则完成该任务所需的时间即为Nt。若以传统的方式,则完成k个任务所需的时间是kNt;而使用流水线技术执行,且花费的时间是Nt+(k-1)t。也就是说,除了第1个任务需要完整的时间外,其他都通过并行,节省下了大量的时间。所以流水线的执行时间可通俗的表达为:
流水线执行时间=第1条指令的执行时间+(n-1)×流水线周期
注:n代表需要处理的任务数量。
这里需要特别注意一个细节问题,流水线的执行时间计算,其实进一步可以分理 论情况与实践情况两种不同的处理方式。下面以实例进行说明。
例:某计算机系统,一条指令的执行需要经历取指(2ms)、分析(4ms)、执行(1ms)三个阶段,现要执行100条指令,利用流水线技术需要多长时间? 理论上来说,1条指令的执行时间为:2ms+4ms+1ms=7ms。 所以:理论流水线执行时间=2ms+4ms+1ms+(100-1)×4=403ms。 而实际上,真正做流水线处理时,考虑到处理的复杂性,会将指令的每个执行阶段的时间都统一为流水线周期,即1条指令的执行时间为:4ms+4ms+4ms=12ms。 所以:实际流水线执行时间=4ms+4ms+4ms+(100-1)×4=408ms。
3、流水线的吞吐率
流水线的吞吐率(Though Put rate,TP)是指在单位时间内流水线所完成的任务数量或输出的结果数量。有些文献也称为平均吞吐率、实际吞吐率。计算流水线吞吐率的最基本的公式如下:
其中n为任务数,Tk是处理完成n个任务所用的时间。
流水线的最大吞吐率为:
4、流水线的加速比
在流水线中,因为在同一时刻,有多个任务在重叠地执行,虽然完成一个任务的时间与单独执行该任务相近(甚至由于分段的缘故,可能更多一些),但是从整体上看完成多个任务所需的时间则大大减少。
完成同样一批任务,不使用流水线所用的时间与使用流水线所用的时间之比称为流水线的加速比(speedup ratio)。如果不使用流水线,即顺序执行所用的时间为T0,使用流水线的执行时间为Tk,则计算流水线加速比的基本公式如下:
如果流水线各个流水段的执行时间都相等(设为∆t),则一条k段流水线完成n个连续任务所需要的时间为(k+n-1)∆t。如果不使用流水线,即顺序执行这n个任务,则所需要的时间为nk∆t。因此,各个流水段执行时间均相等的一条k段流水线完成n个连续任务时的实际加速比为:
这种情况下的最大加速比为: