认识汇编1.机器语言机器语言是机器指令的集合，机器指令展开来讲就是一台机器可以正确执行的命令。电子计算机的机器指令是一

1.机器语言

机器语言是机器指令的集合，机器指令展开来讲就是一台机器可以正确执行的命令。电子计算机的机器指令是一列二进制数字。计算机将之转变为一列高低电平，以使计算机的电子器件受到驱动，进行运算。早期计算机的概念就是可以执行机器指令，进行运算的机器。现在，在我们常用的PC机中，有一个芯片来完成上面所说的计算机的功能。这个芯片就是我们常说的CPU（Central Processing Unit,中央处理单元），CPU是一种微处理器。以后我们提到的计算机是指由CPU和其他受CPU直接或间接控制的芯片、器件、设备组成的计算机系统，比如我们最常见的PC机。

每一种微处理器，由于硬件设计和内部结构的不同，就需要用不同的电平脉冲来控制，使它工作。所以每一种微处理器都有自己的机器指令集，也就是机器语言

早期的程序设计均使用机器语言。程序员们将用0、1数字编成的程序代码打在纸带或卡片上，1打孔，0不打孔，再将程序通过纸带机或卡片机输入计算机，进行运算。

应用8086CPU完成运算s=768+12288T280,机器码如下。

101110000000000000000011
000001010000000000110000
001011010000000000000101

假如将程序错写成以下这样，请你找出错误。

101100000000000000000011
000001010000000000110000
000101101000000000000101 书写和阅读机器码程序不是一件简单的工作，要记住所有抽象的二进制码。上面只是一个非常简单的小程序，就暴露了机器码的晦涩难懂和不易查错。

2.汇编语言的产生

早期的程序员们很快就发现了使用机器语言带来的麻烦，它是如此难于辨别和记忆, 给整个产业的发展带来了障碍。于是汇编语言产生了。

汇编语言的主体是汇编指令。汇编指令和机器指令的差别在于指令的表示方法上。汇编指令是机器指令便于记忆的书写格式。

例如：机器指令1000100111011000表示把寄存器BX的内容送到AX中。汇编指令则写成mov ax,bx这样的写法与人类语言接近，便于阅读和记忆。

操作：寄存器BX的内容送到AX中机器指令：1000100111011000 汇编指令：mov ax,bx

此后，程序员们就用汇编指令编写源程序。可是，计算机能读懂的只有机器指令，那么如何让计算机执行程序员用汇编指令编写的程序呢？这时，就需要有一个能够将汇编指令转换成机器指令的翻译程序，这样的程序我们称其为编译器。程序员用汇编语言写出源程序，再用汇编编译器将其编译为机器码，由计算机最终执行，图1.1描述了这个工作过程。

3.汇编语言组成

汇编语言发展至今，有以下3类指令组成。

汇编指令：机器码的助记符，有对应的机器码。
- 加：INC EAX 通过编译器 0100 0000
- 减：INC EAX 通过编译器 0100 0000
- 乘：INC EAX 通过编译器 0100 0000
- 除：INC EAX 通过编译器 0100 0000
伪指令：没有对应的机器码，由编译器执行，计算机并不执行。
其他符号：如+、-、*、/等，由编译器识别，没有对应的机器码。汇编语言的核心是汇编指令，它决定了汇编语言的特性。

4.存储器(内存)

CPU是计算机的核心部件，它控制整个计算机的运作并进行运算。要想让一个CPU 工作，就必须向它提供指令和数据。指令和数据在存储器中存放，也就是我们平时所说的内存。在一台PC机中内存的作用仅次于CPUo离开了内存，性能再好的CPU也无法工作。这就像再聪明的大脑，没有了记忆也无法进行思考。磁盘不同于内存，磁盘上的数据或程序如果不读到内存中，就无法被CPU使用。要灵活地利用汇编语言编程，我们首先要了解CPU是如何从内存中读取信息，以及向内存中写入信息的。

5.存储单元

存储器被划分成若干个存储单元，每个存储单元从0开始顺序编号，例如一个存储器有128个存储单元，编号从 0〜127,如图1,2所示。

那么一个存储单元能存储多少信息呢？我们知道电子计算机的最小信息单位是bit（音译为比特），也就是一个二进制位。8个bit组成一个Byte,也就是通常讲的一个字节。微型机存储器的存储单元可以存储一个Byte,即8个二进制位。一个存储器有128个存储单元，它可以存储128个Byte。

微机存储器的容量是以字节为最小单位来计算的。对于拥有128个存储单元的存储器，我们可以说，它的容量是 128个字节。

对于大容量的存储器一般还用以下单位来计量容量（以下用B来代表Byte）：

1KB=1O24B 1MB = 1O24KB 1GB = 1024MB 1TB= 1024GB

磁盘的容量单位同内存的一样，实际上以上单位是微机中常用的计量单位。

6.CPU对存储器的读写

以上讲到，存储器被划分成多个存储单元，存储单元从零开始顺序编号。这些编号可以看作存储单元在存储器中的地址。就像一条街，每个房子都有门牌号码。

CPU要从内存中读数据，首先要指定存储单元的地址。也就是说它要先确定它要读取哪一个存储单元中的数据。就像在一条街上找人，先要确定他住在哪个房子里。

另外，在一台微机中，不只有存储器这一种器件。CPU在读写数据时还要指明，它要对哪一个器件进行操作，进行哪种操作，是从中读出数据，还是向里面写入数据。

可见，CPU要想进行数据的读写，必须和外部器件（标准的说法是芯片）进行下面3类信息的交互。

地址总线：存储单元的地址（地址信息）；
控制总线：器件的选择，读或写的命令（控制信息）；
数据总线：读或写的数据（数据信息）。

那么CPU是通过什么将地址、数据和控制信息传到存储器芯片中的呢？电子计算机能处理、传输的信息都是电信号，电信号当然要用导线传送。在计算机中专门有连接 CPU和其他芯片的导线，通常称为总线。总线从物理上来讲，就是一根根导线的集合。根据传送信息的不同，总线从逻辑上又分为3类，地址总线、控制总线和数据总线。

CPU通过地址线将地址信息3发出；
CPU通过控制线发出内存读命令，选中存储器芯片，并通知它，将要从中读取数据；
存储器将3号单元中的数据8通过数据线送入CPU；

写操作与读操作的步骤相似。如向3号单元写入数据26

CPU通过地址线将地址信息3发出；
CPU通过控制线发出内存写命令，选中存储器芯片，并通知它，要向其中写入数据；
CPU通过数据线将数据26送入内存的3号单元中。

7.地址总线

CPU是通过地址总线来指定存储器单元的。可见地址总线上能传送多少个不同的信息，CPU就可以对多少个存储单元进行寻址。

现假设，一个CPU有10根地址总线，让我们来看一下它的寻址情况。我们知道，在电子计算机中，一根导线可以传送的稳定状态只有两种，高电平或是低电平。用二进制表示就是1或0, 10根导线可以传送10位二进制数据。而10位二进制数可以表示多少个不同的数据呢？2的10次方个。最小数为0,最大数为1023；

图1.4展示了一个具有10根地址线的CPU向内存发出地址信息11时10根地址线上传送的二进制信息。考虑一下，访问地址为12、13、14等的内存单元时，地址总线上传送的内容是什么？

一个CPU有N根地址线，则可以说这个CPU的地址总线的宽度为No这样的CPU 最多可以寻找2的N次方个内存单元。

8.数据总线

CPU与内存或其他器件之间的数据传送是通过数据总线来进行的。数据总线的宽度决定了 CPU和外界的数据传送速度。8根数据总线一次可传送一个8位二进制数据（即一个字节），16根数据总线一次可传送两个字节。

8088CPU的数据总线宽度为8, 8086CPU的数据总线宽度为16。我们来分别看一下它们向内存中写入数据89D8H时，是如何通过数据总线传送数据的。图1.5展示了 8088CPU 数据总线上的数据传送情况；图1.6展示了 8086CPU数据总线上的数据传送情况。

8086有16根数据线，可一次传送16位数据，所以可一次传送数据89D8H；而8088 只有8根数据线，一次只能传8位数据，所以向内存写入数据89D8H时需要进行两次数据传送；

9.控制总线

CPU对外部器件的控制是通过控制总线来进行的。在这里控制总线是个总称，控制总线是一些不同控制线的集合。有多少根控制总线，就意味着CPU提供了对外部器件的多少种控制。所以，控制总线的宽度决定了 CPU对外部器件的控制能力。

前面所讲的内存读或写命令是由几根控制线综合发出的，其中有一根称为“读信号输出”的控制线负责由CPU向外传送读信号，CPU向该控制线上输出低电平表示将要读取数据；有一根称为“写信号输岀”的控制线则负责传送写信号。

总结：
(1)汇编指令是机器指令的助记符，同机器指令一一对应。
(2)每一种CPU都有自己的汇编指令集。
(3)CPU可以直接使用的信息在存储器中存放。
(4)在存储器中指令和数据没有任何区别，都是二进制信息。
(5)存储单元从零开始顺序编号。
(6)一个存储单元可以存储8个bit,即8位二进制数。
(7)lByte=8bit 1KB=1O24B 1MB=1024KB 1 GB=1024MB0 	
(8)每一个CPU芯片都有许多管脚，这些管脚和总线相连。也可以说，这些管脚引出总线。一个 CPU可以引出3种总线的宽度标志了这个CPU的不同方面的性能：
地址总线的宽度决定了 CPU的寻址能力；
数据总线的宽度决定了 CPU与其他器件进行数据传送时的一次数据传送量；
控制总线的宽度决定了 CPU对系统中其他器件的控制能力。

练习题：
(1)1个CPU的寻址能力为8KB,那么它的地址总线的宽度为(13);// 1kb = 2的10次方
(2)1KB的存储器有 (8)个存储单元。存储单元的编号从(0)到(127);
(3)1KB的存储器可以存储(1024 * 8)个bit,(1024)个Byte;
(4)8080、8088、80286、80386的地址总线宽度分别为16根、20根、24根、32 根，则它们的寻址能力分别为：(64)KB、(1)MB、(16)MB、(4)GB;
(6)8080、8088、8086、80286、80386的数据总线宽度分别为8根、8根、16根、16 根、32根。则它们一次可以传送的数据为：(1)(B)、(1)(B)、(2)(B)、(2)(B)、(4)(B);
(7)从内存中读取1024字节的数据，8086至少要读(512)次，80386至少要读(256)次。

10.各类存储器芯片

一台pc机中，装有多个存储器芯片，这些存储器芯片从物理连接上看是独立的、不同的器件。从读写属性上看分为两类：随机存储器（RAM）和只读存储器（ROM）o随机存储器可读可写，但必须带电存储，关机后存储的内容丢失；只读存储器只能读取不能写入，关机后其中的内容不丢失。这些存储器从功能和连接上又可分为以下几类。

随机存储器用于存放供CPU使用的绝大部分程序和数据，主随机存储器一般由两个位置上的RAM组成，装在主板上RAM和插在扩展插槽上的RAM。
装有 BIOS（Basic Input/Output System,基本输入/输出系统）的ROM， BIOS是由主板和各类接口卡（如显卡、网卡等）厂商提供的软件系统，可以通过它利用该硬件设备进行最基本的输入输出。在主板和某些接口卡上插有存储相应 BIOS的ROM。例如，主板上的ROM中存储着主板的BIOS（通常称为系统 BIOS）；显卡上的ROM中存储着显卡的BIOS；如果网卡上装有ROM,那其中就可以存储网卡的BIOS。
接口卡上的RAM 某些接口卡需要对大批量输入、输出数据进行暂时存储，在其上装有RAMo最典型的是显示卡上的RAM, 一般称为显存。显示卡随时将显存中的数据向显示器上输出。换句话说，我们将需要显示的内容写入显存，就会出现在显示器上。

11.内存地址空间

上述的那些存储器，在物理上是独立的器件，但是在以下两点上相同。

都和CPU的总线相连。
CPU对它们进行读或写的时候都通过控制线发出内存读写命令。这也就是说，CPU在操控它们的时候，把它们都当作内存来对待，把它们总的看作一个由若干存储单元组成的逻辑存储器，这个逻辑存储器就是我们所说的内存地址空间。在汇编这门课中，我们所面对的是内存地址空间。

在图1.8中，所有的物理存储器被看作一个由若干存储单元组成的逻辑存储器，每个物理存储器在这个逻辑存储器中占有一个地址段，即一段地址空间。CPU在这段地址空间中读写数据，实际上就是在相对应的物理存储器中读写数据。

假设，图1.8中的内存地址空间的地址段分配如下。

地址0-7FFFH的32KB空间为主随机存储器的地址空间；
地址8000H〜9FFFH的8KB空间为显存地址空间；
地址AOOOH-FFFFH的24KB空间为各个ROM的地址空间。

这样，CPU向内存地址为1000H的内存单元中写入数据，这个数据就被写入主随机存储器中；CPU向内存地址为8000H的内存单元中写入数据，这个数据就被写入显存中，然后会被显卡输出到显示器上；CPU向内存地址为C000H的内存单元中写入数据的操作是没有结果的，C000H单元中的内容不会被改变，C000H单元实际上就是ROM存储器中的一个单元。

内存地址空间的大小受CPU地址总线宽度的限制。8086CPU的地址总线宽度为20, 可以传送22°个不同的地址信息（大小从0至220-1）o即可以定位22°个内存单元，则 8086PC的内存地址空间大小为1MB。同理，80386CPU的地址总线宽度为32,则内存地址空间最大为4GB。

我们在基于一个计算机硬件系统编程的时候，必须知道这个系统中的内存地址空间分配情况。因为当我们想在某类存储器中读写数据的时候，必须知道它的第一个单元的地址和最后一个单元的地址，才能保证读写操作是在预期的存储器中进行。比如，我们希望向显示器输出一段信息，那么必须将这段信息写到显存中，显卡才能将它输岀到显示器上。要向显存中写入数据，必须知道显存在内存地址空间中的地址。

不同的计算机系统的内存地址空间的分配情况是不同的，图1.9展示了 8086PC机内存地址空间分配的基本情况。

图1.9告诉我们，从地址0〜9FFFF的内存单元中读取数据，实际上就是在读取主随机存储器中的数据；向地址AOOOO-BFFFF的内存单元中写数据，就是向显存中写入数据，这些数据会被显示卡输出到显示器上；我们向地址C0000〜FFFFF的内存单元中写入数据的操作是无效的，因为这等于改写只读存储器中的内容。

本文来自王爽《汇编语言第三版》