计算机系统结构

598 阅读7分钟

计算机系统结构

4.存储体系

4.1多存储体系层次

存储层次的每位价格

二级存储体系( M1,M2)为例来分析。设ci为Mi的每位价格,Smi为以位计算的存储容量,为CPU访问到Mi中的信息所需的时间。为评价存储层次性能,引入存储层次的每位价格c命中率H和等效访问时间TA。 存储层次的每位价格 c=(c1Sm1+c2Sm2)/(Sm1+Sm2)

※4.2虚拟存储器的管理方式

根据存储映像算法的不同,可有多种不同的存储管理方式的虚拟存储器,其中主要有段式,页式,段页式

页式虚拟存储器

※1.地址的映像和变换(单选)

是采用页式存储管理主存一辅存存储层次

2.全相联映像

3.相联目录表法 该表最多为2^nv

※4.页面替换算法

​ 堆栈型替换算法:LRU算法OPT算法

​ 影响主存命中率和CPU效率的某些因素程序地址流,替换算法,实页数(主存容量)不同都会影响命中率

4.3高速缓存存储器

Cache存储器的透明性的解决方案一般可有写回法,直达法

并行向量处理机的互连网络是纵横交叉开关

5主存

※5.1主存相关处理

对主存同一单元要求先写后读 要想不出错 退后“分析K+1”的读

※推后“分析K+1”和设置“相关专用通道”是解决重叠方式相关处理的两种基本方法,前者 是以降低速度为代价

5.2流水线

流水线分为部件级,处理机,系统级的划分依据处理的级别

按多功能流水线的各段能否允许同时用于多种不同功能连接流水,可把流水线分为静态流水线动态流水线

静态 多一

动态 多多

从计算机所具有的数据表示角度,可以把流水线处理机分为标量流水机向量流水机

标量流水机的性能主要是

  1. 吞吐率TP 加速比SP
  2. 效率

流水线中各功能段之间是否有反馈回路的角度,可以把流水线分为线性流水线非线性流水线

重叠机器处理局部相关的方法有两种退后后续指令的读,设置直接通路

6. 互联网络的设计目标与互连函数

【简答】SIMD系统的互连网络的设计目标是: 1)结构不要过分复杂,以降低成本; 2)互连要灵活,以满足算法和应用的需要; 3)处理单元间信息交换所需的传送步数要尽可能少,以提高速度性能; 4)能用规整单一的基本构件组合而成,或者经多次通过或者经多级连接来实现复杂的互连, 使模块性好,以便于用VLSI实现并满足系统的可扩充性。 (口诀:简洁、规整、让系统有好又快又便宜)

阵列机(SIMD)同时性(操作级并行)

计算量大的适合用脉动阵列机 脉动阵列机的特点:

1)结构简单、规整,模块化强,可扩充性好,常适合用超大规模集成电路实现。 2)PE间数掘通信距离短、规则,使数据流和控制流的设计、同步控制等均简单规整。 3)脉动阵列中所有PE能同时运算,具有极高的计算并行性,可通过流水获得很高的运算效率和吞吐率。输入数据能被多个处理单元重复便用,大大减轻了阵列与外界的 I/O通信量,降低了对系统主存和I/O系统频宽的要求。 4脉动阵列结构的构形与特定计算任务和算法密切相关,具有某种专用性,限制了应用范围,这对VLSI是不利的。

VLSI=>超大规模集成电路

基本的互联网络

立体单机网络

7. 多处理机(任务级别) MIMD(并发性)-多指令多数据流

操作(向量处理机)->指令->程序->任务(多处理机) 由小到大

  • 多处理机共享I/O子系统,机间共享主存高速网络通信

  • 使用多处理机的目的(填空,简答)

    • 通过多处理机对多个作业,任务并行执行来提高解题速度,从而提高系统的整体性能;

    • 使用冗余的多处理机通过重新组织来提高系统的可靠性,适应性,可用性

  • 多处理机可以有 同构型,异构型,分布型

  • 技术问题

    • 硬件结构上,它的多个处理机要用多个指令部件分别控制,通过 共享主存或机间互连网络实现异步通信;
    • 算法上 ,不限于向量、数组处理,还要挖掘和实现更多通用算法 中隐含的并行性;
    • 系统管理上 ,要更多地依靠操作系统等软件手段,有效地解决资 源分析和管理,特别是任务分配、处理机调度、进程的同步和通信等问 题
  • 多处理系统中,要较好地解决动态的资源分配和任务调度,让各处理机的负荷尽可能均衡,并要防止死锁

  • 多处理机的硬件结构

    • 紧耦合多处理机

      • 共享主存
      • 层次性,非层次性
      • 多Cache的一致性问题解决办法
        • 解决进程迁移引起多Cache的不一致性:方案禁止进程迁移线程挂起用硬件方法
        • 硬件为基础实现 : 监控Cache协议法目录表法
        • 软件为基础实现 :不把公用可写的数据存入Cache中
    • 松耦合多处理机(多端口存储器适合连接

      • 通过互联实现通信/消息传送系统
  • 多处理机的互连一半采用总线,环形互连,交叉开关,多端口存储器,蠕虫穿洞寻径网络等几种形式。

  • 多处理机为减少访问主存冲突,采用的方式一般是:并行多体交叉主存系统

  • 并行算法

    • 根据各处理机计算任务的大小(粒度)分为
      • 细粒度 向量 和循环级的并行
      • 中粒度 较大循环机
      • 粗粒度 任务级
    • 根据进程间的操作顺序不同,并行算法又分为同步性,异步性,独立性
  • 多处理机操作系统

    • 主从型
    • 各自独立型
    • 浮动型
  • 计算机3T性能目标是1 TFLOPS的计算能力1Tbyte的主存容量 1 byte/s的I/O带宽

  • 数据反相关可以并行不可以交换串行

  • 多处理机的发展

    • 机群系统比起传统的并行处理系统由如下明显优点:

      • 系统有高的性能价格比。

      • 系统的开发周期短。

      • 系统的可扩展性好。

      • 系统的资源利用率高。

      • 用户投资风险小。

      • 用户编程方便。

        (口快:简单好用价格低)

8. 数据驱动概念

8.1数据流

  • 数据驱动的数据流方式中,数据令牌是一种表示某一个操作数,参数已准备就绪的标志
  • 语义上,数据流是基于异步性,函数性的一种计算模型。
  • 根据对数据令牌处理方式的不同 可分为 静态 和 动态两类

大题

并行主存系统

并行主存系统 并行主存系统

※中断响应图

6.3

通道处理机

6.4

存储映射关系图

6.6

※Cache命中率

6.7 6.8

6.9

※流水线状态转移图

7.0 7.1

※计算指令所需拍数

7.2 7.3

※※【填空,选择】互联逻辑函数图(Cube,全混,蝶形)

7.8

※单级互联网络

7.7

※※并行算法题目

【1704真题】由霍纳法则给定的表达式如下:E=a(bc+d(ef +g(h+ij))) 利用减少树高的办法来加速运算,要求: 1、画出树形流程图; 2、确定Tp、P、Sp、Ep的值。

8.8

资源时间图

8.9

其他

2答案 *

3题目

用的是全混(shuffle) 最高位移到最低位

总结

9.0