计算机系统结构计算机系统结构 4.存储体系 4.1多存储体系层次 ※4.2虚拟存储器的管理方式根据存储映像算法的不同，

计算机系统结构

4.存储体系

4.1多存储体系层次

存储层次的每位价格

二级存储体系( M1，M2)为例来分析。设ci为Mi的每位价格，Smi为以位计算的存储容量，为CPU访问到Mi中的信息所需的时间。为评价存储层次性能，引入存储层次的每位价格c命中率H和等效访问时间TA。存储层次的每位价格 c=(c1Sm1+c2Sm2)/(Sm1+Sm2)

※4.2虚拟存储器的管理方式

根据存储映像算法的不同，可有多种不同的存储管理方式的虚拟存储器，其中主要有段式，页式，段页式

页式虚拟存储器

※1.地址的映像和变换（单选）

是采用页式存储和管理的主存一辅存存储层次

2.全相联映像

3.相联目录表法该表最多为2^nv 行

※4.页面替换算法

堆栈型替换算法:LRU算法， OPT算法

影响主存命中率和CPU效率的某些因素程序地址流，替换算法，实页数(主存容量)不同都会影响命中率

4.3高速缓存存储器

Cache存储器的透明性的解决方案一般可有写回法，直达法

并行向量处理机的互连网络是纵横交叉开关

5主存

※5.1主存相关处理

对主存同一单元要求先写后读要想不出错退后“分析K+1”的读

※推后“分析K+1”和设置“相关专用通道”是解决重叠方式相关处理的两种基本方法，前者是以降低速度为代价

5.2流水线

流水线分为部件级，处理机，系统级的划分依据处理的级别

按多功能流水线的各段能否允许同时用于多种不同功能连接流水，可把流水线分为静态流水线和动态流水线

静态多一

动态多多

从计算机所具有的数据表示角度，可以把流水线处理机分为标量流水机和向量流水机

标量流水机的性能主要是

吞吐率TP 加速比SP

效率

从流水线中各功能段之间是否有反馈回路的角度，可以把流水线分为线性流水线和非线性流水线。

重叠机器处理局部相关的方法有两种退后后续指令的读，设置直接通路

6. 互联网络的设计目标与互连函数

【简答】SIMD系统的互连网络的设计目标是： 1）结构不要过分复杂，以降低成本； 2）互连要灵活，以满足算法和应用的需要； 3）处理单元间信息交换所需的传送步数要尽可能少，以提高速度性能； 4）能用规整单一的基本构件组合而成，或者经多次通过或者经多级连接来实现复杂的互连，使模块性好，以便于用VLSI实现并满足系统的可扩充性。（口诀：简洁、规整、让系统有好又快又便宜）

阵列机(SIMD)同时性(操作级并行)

计算量大的适合用脉动阵列机脉动阵列机的特点：

1)结构简单、规整，模块化强，可扩充性好，常适合用超大规模集成电路实现。 2)PE间数掘通信距离短、规则，使数据流和控制流的设计、同步控制等均简单规整。 3)脉动阵列中所有PE能同时运算，具有极高的计算并行性，可通过流水获得很高的运算效率和吞吐率。输入数据能被多个处理单元重复便用，大大减轻了阵列与外界的 I/O通信量，降低了对系统主存和I/O系统频宽的要求。 4脉动阵列结构的构形与特定计算任务和算法密切相关，具有某种专用性，限制了应用范围，这对VLSI是不利的。

VLSI=>超大规模集成电路

基本的互联网络

立体单机网络

7. 多处理机(任务级别) MIMD(并发性)-多指令多数据流

操作(向量处理机)->指令->程序->任务(多处理机) 由小到大

多处理机共享I/O子系统，机间共享主存或高速网络通信
使用多处理机的目的(填空，简答)
- 通过多处理机对多个作业，任务并行执行来提高解题速度，从而提高系统的整体性能；
- 使用冗余的多处理机通过重新组织来提高系统的可靠性，适应性，可用性
多处理机可以有 同构型，异构型，分布型 。
技术问题
- 在硬件结构上，它的多个处理机要用多个指令部件分别控制，通过共享主存或机间互连网络实现异步通信；
- 在算法上，不限于向量、数组处理，还要挖掘和实现更多通用算法中隐含的并行性；
- 在系统管理上，要更多地依靠操作系统等软件手段，有效地解决资源分析和管理，特别是任务分配、处理机调度、进程的同步和通信等问题
多处理系统中，要较好地解决动态的资源分配和任务调度，让各处理机的负荷尽可能均衡，并要防止死锁。
多处理机的硬件结构
- 紧耦合多处理机
  - 共享主存
  - 层次性，非层次性
  - 多Cache的一致性问题解决办法
    - 解决进程迁移引起多Cache的不一致性：方案禁止进程迁移，线程挂起用硬件方法
    - 硬件为基础实现：监控Cache协议法和目录表法
    - 软件为基础实现：不把公用可写的数据存入Cache中
- 松耦合多处理机（多端口存储器适合连接）
  - 通过互联实现通信/消息传送系统
多处理机的互连一半采用总线，环形互连，交叉开关，多端口存储器，蠕虫穿洞寻径网络等几种形式。
多处理机为减少访问主存冲突，采用的方式一般是：并行多体交叉主存系统
并行算法
- 根据各处理机计算任务的大小（粒度）分为
  - 细粒度向量和循环级的并行
  - 中粒度较大循环机
  - 粗粒度任务级
- 根据进程间的操作顺序不同，并行算法又分为同步性，异步性，独立性
多处理机操作系统
- 主从型
- 各自独立型
- 浮动型
计算机3T性能目标是1 TFLOPS的计算能力，1Tbyte的主存容量和 1 byte/s的I/O带宽
数据反相关可以并行不可以交换串行
多处理机的发展
- 机群系统比起传统的并行处理系统由如下明显优点：
  - 系统有高的性能价格比。
  - 系统的开发周期短。
  - 系统的可扩展性好。
  - 系统的资源利用率高。
  - 用户投资风险小。
  - 用户编程方便。
    
    （口快：简单好用价格低）