计算机系统结构
4.存储体系
4.1多存储体系层次
存储层次的每位价格
二级存储体系( M1,M2)为例来分析。设ci为Mi的每位价格,Smi为以位计算的存储容量,为CPU访问到Mi中的信息所需的时间。为评价存储层次性能,引入存储层次的每位价格c命中率H和等效访问时间TA。 存储层次的每位价格 c=(c1Sm1+c2Sm2)/(Sm1+Sm2)
※4.2虚拟存储器的管理方式
根据存储映像算法的不同,可有多种不同的存储管理方式的虚拟存储器,其中主要有段式,页式,段页式
页式虚拟存储器
※1.地址的映像和变换(单选)
是采用
页式存储和管理的主存一辅存存储层次2.全相联映像
3.相联目录表法 该表最多为
2^nv行※4.页面替换算法
堆栈型替换算法:
LRU算法,OPT算法 影响主存命中率和CPU效率的某些因素
程序地址流,替换算法,实页数(主存容量)不同都会影响命中率
4.3高速缓存存储器
Cache存储器的透明性的解决方案一般可有
写回法,直达法并行向量处理机的互连网络是
纵横交叉开关
5主存
※5.1主存相关处理
对主存同一单元要求先写后读 要想不出错 退后
“分析K+1”的读※推后
“分析K+1”和设置“相关专用通道”是解决重叠方式相关处理的两种基本方法,前者 是以降低速度为代价
5.2流水线
流水线分为
部件级,处理机,系统级的划分依据处理的级别按多功能流水线的各段能否允许同时用于多种不同功能连接流水,可把流水线分为
静态流水线和动态流水线静态 多一
动态 多多
从计算机所具有的
数据表示角度,可以把流水线处理机分为标量流水机和向量流水机标量流水机的性能主要是
- 吞吐率TP 加速比SP
- 效率
从
流水线中各功能段之间是否有反馈回路的角度,可以把流水线分为线性流水线和非线性流水线。重叠机器处理局部相关的方法有两种
退后后续指令的读,设置直接通路
6. 互联网络的设计目标与互连函数
【简答】SIMD系统的互连网络的设计目标是: 1)结构不要过分复杂,以降低成本; 2)互连要灵活,以满足算法和应用的需要; 3)处理单元间信息交换所需的传送步数要尽可能少,以提高速度性能; 4)能用规整单一的基本构件组合而成,或者经多次通过或者经多级连接来实现复杂的互连, 使模块性好,以便于用VLSI实现并满足系统的可扩充性。 (口诀:简洁、规整、让系统有好又快又便宜)
阵列机(SIMD)同时性(操作级并行)
计算量大的适合用脉动阵列机 脉动阵列机的特点:
1)结构简单、规整,模块化强,
可扩充性好,常适合用超大规模集成电路实现。 2)PE间数掘通信距离短、规则,使数据流和控制流的设计、同步控制等均简单规整。 3)脉动阵列中所有PE能同时运算,具有极高的计算并行性,可通过流水获得很高的运算效率和吞吐率。输入数据能被多个处理单元重复便用,大大减轻了阵列与外界的 I/O通信量,降低了对系统主存和I/O系统频宽的要求。 4脉动阵列结构的构形与特定计算任务和算法密切相关,具有某种专用性,限制了应用范围,这对VLSI是不利的。VLSI=>超大规模集成电路
基本的互联网络
立体单机网络
7. 多处理机(任务级别) MIMD(并发性)-多指令多数据流
操作(向量处理机)->指令->程序->任务(多处理机) 由小到大
-
多处理机共享
I/O子系统,机间共享主存或高速网络通信 -
使用多处理机的
目的(填空,简答)-
通过多处理机对多个
作业,任务并行执行来提高解题速度,从而提高系统的整体性能; -
使用
冗余的多处理机通过重新组织来提高系统的可靠性,适应性,可用性
-
-
多处理机可以有
同构型,异构型,分布型。 -
技术问题
- 在
硬件结构上,它的多个处理机要用多个指令部件分别控制,通过 共享主存或机间互连网络实现异步通信; - 在
算法上 ,不限于向量、数组处理,还要挖掘和实现更多通用算法 中隐含的并行性; - 在
系统管理上 ,要更多地依靠操作系统等软件手段,有效地解决资 源分析和管理,特别是任务分配、处理机调度、进程的同步和通信等问 题
- 在
-
多处理系统中,要较好地解决动态的资源分配和任务调度,让各处理机的
负荷尽可能均衡,并要防止死锁。 -
多处理机的硬件结构
-
紧耦合多处理机
- 共享主存
- 层次性,非层次性
- 多Cache的一致性问题解决办法
- 解决
进程迁移引起多Cache的不一致性:方案禁止进程迁移,线程挂起用硬件方法 硬件为基础实现 : 监控Cache协议法和目录表法软件为基础实现 :不把公用可写的数据存入Cache中
- 解决
-
松耦合多处理机(多端口存储器适合连接)
- 通过互联实现通信/消息传送系统
-
-
多处理机的互连一半采用
总线,环形互连,交叉开关,多端口存储器,蠕虫穿洞寻径网络等几种形式。 -
多处理机为减少访问主存冲突,采用的方式一般是:
并行多体交叉主存系统 -
并行算法
- 根据各处理机计算任务的大小(粒度)分为
- 细粒度 向量 和循环级的并行
- 中粒度 较大循环机
- 粗粒度 任务级
- 根据进程间的操作顺序不同,并行算法又分为
同步性,异步性,独立性
- 根据各处理机计算任务的大小(粒度)分为
-
多处理机操作系统
- 主从型
- 各自独立型
- 浮动型
-
计算机3T性能目标是
1 TFLOPS的计算能力,1Tbyte的主存容量和1 byte/s的I/O带宽 -
数据反相关
可以并行不可以交换串行 -
多处理机的发展
-
机群系统比起传统的并行处理系统由如下明显优点:
-
系统有高的性能价格比。
-
系统的开发周期短。
-
系统的可扩展性好。
-
系统的资源利用率高。
-
用户投资风险小。
-
用户编程方便。
(口快:简单好用价格低)
-
-
8. 数据驱动概念
8.1数据流
- 数据驱动的数据流方式中,数据令牌是一种表示某一个
操作数,参数已准备就绪的标志 - 语义上,数据流是基于
异步性,函数性的一种计算模型。 - 根据对数据令牌处理方式的不同 可分为
静态 和 动态两类
大题
并行主存系统
※中断响应图
通道处理机
存储映射关系图
※Cache命中率
※流水线状态转移图
※计算指令所需拍数
※※【填空,选择】互联逻辑函数图(Cube,全混,蝶形)
※单级互联网络
※※并行算法题目
【1704真题】由霍纳法则给定的表达式如下:E=a(bc+d(ef +g(h+ij))) 利用减少树高的办法来加速运算,要求: 1、画出树形流程图; 2、确定Tp、P、Sp、Ep的值。
资源时间图
其他
*
用的是全混(shuffle) 最高位移到最低位