1.网络层概述

网络层的主要任务是实现网络互连，进而实现数据包在各网络之间的传输。

要实现网络层任务，需要解决以下主要问题：

网络层向运输层提供怎样的服务（“可靠传输”还是“不可靠传输”）
网络层寻址问题
路由选择问题

因特网是目前全世界用户数量最多的互联网，它使用TCP/IP协议栈

由于TCP/IP协议栈的网络层使用网际协议IP，它是整个协议栈的核心协议，因此在TCP/IP协议栈中网络层常称为网际层

2.网络层提供的两种服务

2.1 面向连接的虚电路服务

可靠通信由网络来保证
必须建立网络层的连接——虚电路VC（Virtual Circuit）
通信双方沿着已建立的虚电路发送分组
目的主机的地址仅在连接建立阶段使用，之后每个分组的首部只需携带一条虚电路的编号（构成虚电路的每一段链路都有一个虚电路编号）
这种通信方式如果再使用可靠传输的网络协议，就可使所发送的分组最终正确到达接收方（无差错按序到达、不丢失、不重复）
通信结束后，需要释放之前所建立的虚电路。
很多广域分组交换网都使用面向连接的虚电路服务。

2.2 无连接的数据包服务

可靠通信应当由用户主机来保证
不需要建立网络层连接
每个分组可走不同的路径
每个分组的首部必须携带目的主机的完整地址
这种通信方式所传送的分组可能误码、丢失、重复和失序
由于网络本身不提供端到端的可靠传输服务，这就使网络中的路由器可以做得比较简单，而且价格低廉（与电信网的交换机相比较）
因特网采用了这种设计思想，也就是将复杂的网络处理功能置于因特网的边缘（用户主机和其内部的运输层），而将相对简单的尽最大努力的分组交付功能置于因特网核心。

比较

3.IPv4地址

3.1 IPv4地址概述

在TCP/IP体系中，IP地址是一个最基本的概念
IPv4地址就是给因特网上的每一台主机（或路由器）的每一个接口分配一个在全世界范围内是唯一的32比特的标识符
IP地址由因特网名字和数字分配机构ICANN进行分配
IPv4地址的编制方法经历了如下三个历史阶段：

32比特的IPv4地址不方便阅读、记录以及输入等，因此IPv4地址采用点分十进制表示方法以方便用户使用

3.2 分类编制的IPv4地址

注意事项

只有A、B、C类地址可分配给网络中的主机或路由器的各接口
主机号为“全0”的地址是网络地址，不能分配给主机或路由器的各接口
主机号为“全1”的地址是广播地址，不能分配给主机或路由器的各接口

A类地址

最小网络号0，保留不指派

第一个可指派的网络号为1，最后一个可指派的网络号为126

最大网络号127，作为本地环回测试地址，不指派

最小的本地环回测试地址为127.0.0.1

最大的本地环回测试地址为127.255.255.254

B类地址

最小网络号也是第一个可指派的网络号128.0

网络地址为128.0.0.0

最大网络号也是最后一个可指派的网络号191.255

网络地址为191.255.0.0

C类地址

最小网络号也是第一个可指派的网络号192.0.0

网络地址为192.0.0.0

最大网络号也是最后一个可指派的网络号223.255.255

网络地址为223.255.255.0

3.3 划分子网的IPv4地址

为新增网络申请新的网络号会带来以下弊端：

需要等待时间和花费更多的费用
会增加其他路由器中路由表记录的数据
浪费原有网络号中剩余的大量IP地址

可以从主机号部分借用一部分比特作为子网号

32比特的子网掩码可以表明分类IP地址的主机号部分被借用了几个比特作为子网号

子网掩码使用连续的比特1来对应网络号和子网号
子网掩码使用连续的比特0来对应主机号
将划分子网的IPv4地址与其相应的子网掩码进行逻辑与运算就可得到IPv4地址所在子网的网络地址

默认的子网掩码是指在未划分子网的情况下使用的子网掩码

A类地址：255.0.0.0

B类地址：255.255.0.0

C类地址：255.255.255.0

3.4 无分类编制的IPv4地址

划分子网在一定程度上缓解了因特网在发展中遇到的困难，但是数量巨大的C类网因为其地址空间太小并没有得到充分使用，而因特网的IP地址仍在加速消耗，整个IPv4地址空间面临全部耗尽的威胁。

为此，因特网工程任务组IETF又提出了采用无分类编址的方法来解决IP地址紧张的问题，同时还专门成立IPv6工作组负责研究新版本IP以彻底解决IP地址耗尽的问题。

1993年，IETF发布了无分类域间路由选择CIDR的RFC文档：RFC 1517~1519和1520

CIDR消除了传统的A类、B类和C类地址，以及划分子网的概念
CIDR可以更加有效地分配IPv4的地址空间，并且可以在新的IPv6使用之前允许因特网的规模继续增长

CIDR使用“斜线记法”，或称CIDR记法，即在IPv4地址后面加上斜线“/”，在斜线后面写上网络前缀所占的比特数量。

例:128.14.35.7/20

网络前缀占用的比特数量：20

主机编号占用的比特数量：12

CIDR实际上是将网路前缀都相同的连续的IP地址组成一个“CIDR地址块”

我们只要知道CIDR地址块中的任何一个地址，就可以知道该地址块的全部细节：

地址块的最小地址
地址块的最大地址
地址块中地址的数量
地址块聚合某类网络（A类、B类或C类）的数量
地址掩码（也可继续称为子网掩码）

路由聚合（构造超网）

网络前缀越长，地址块越小，路由越具体。

若路由器查表转发分组时发现有多条路由可选，则选择网络前缀最长的那条，这称为最长前缀匹配，因为这样的路由更具体。

3.5 IPv4地址的应用规划

3.5.1 定长的子网掩码FLSM

使用同一个子网掩码来划分子网
每个子网所分配的IP地址数量相同，造成IP地址的浪费

3.5.2 变长的子网掩码VLSM

使用不同的子网掩码来划分子网
每个子网所分配的IP地址数量可以不同，尽可能减少对IP地址的浪费

4.IP数据报的发送和转发过程

IP数据报的发送和转发包含以下两部分：

主机发送IP数据报

判断目的主机是否与自己在同一个网络

若在同一个网络，则属于直接交付；

若不在同一个网络，则属于间接交付，传输给主机所在网络的默认网关（路由器），由默认网关帮忙转发

路由器转发IP数据报

检查IP数据报首部是否出错

若出错，则直接丢弃该IP数据报并通告源主机

若没有出错，则进行转发

根据IP数据报的目的地址在路由表中查找匹配的条目

若找到匹配的条目，则转发给条目中指示的下一跳

若找不到，则丢弃该IP数据报并通告源主机

5.静态路由配置及其可能产生的路由环路问题

静态路由配置是指用户或网络管理员使用路由器的相关命令给路由器人工配置路由表

这种人工配置方式简单、开销小，但不能及时适应网络状态（流量、拓扑等）的变化
一般只在小规模网络中采用

使用静态路由配置可能出现以下导致产生路由环路的错误

配置错误
聚合了不存在的网络

路由条目的类型

直连网络
静态路由（人工配置）
动态路由（路由选择协议）

特殊的静态路由条目

默认路由（目的网络为0.0.0.0，地址掩码为0.0.0.0）
特定主机路由（目的网络为特定主机的IP地址，地址掩码为255.255.255.255）
黑洞路由（下一跳为null0）

6.路由选择协议

6.1 路由选择协议概述

静态路由选择

由人工配置的网络路由、默认路由、特定主机路由、黑洞路由等都属于静态路由
这种人工配置方式简单、开销小，但不能及时适应网络状态（流量、拓扑等）的变化
一般只在小规模网络中采用

动态路由选择

路由器通过路由选择协议自动获取路由信息
比较复杂、开销比较大。能较好地适应网络状态的变化
适用于大规模网络

因特网所采用的路由选择协议的主要特点

自适应

动态路由选择，能较好地适应网络状态的变化

分布式

路由器之间交换路由信息

分层次

将整个因特网划分为许多较小的自制系统AS

常见的路由选择协议

路由器的基本结构

6.2 路由信息协议RIP的基本工作原理

路由信息协议RIP是内部网关协议IGP中最先得到广泛使用的协议之一，其相关标准文档为RFC 1058

RIP要求自治系统AS内的每一个路由器都要维护从它自己到AS内其他每一个网络的距离记录。这是一组距离，称为“距离向量D-V”

RIP使用跳数作为度量来衡量到达目的网络的距离

路由器到直连网络的距离定义为1
路由器到非直连网络的距离定义为所经过的路由器数加1
允许一条路径最多只能包含15个路由器。“距离”等于16时相当于不可达。因此，RIP只适用于小型互联网

RIP认为好的路由就是“距离短”的路由，也就是所通过路由器数量最少的路由。

当到达同一目的网络有多条“距离相等”的路由时，可以进行等价负载均衡

RIP包含以下三个要点：

和谁交换信息：仅和相邻路由器交换信息

交换什么信息：自己的路由表
何时交换信息：周期性交换（例如每30秒）

RIP的基本工作原理

RIP的路由条目的更新规则

RIP存在“坏消息”传的慢的问题

“坏消息传播得慢”又称为路由环路或距离无穷计数问题，这是距离向量算法的一个固有问题。可以采取多种措施减少出现该问题的概率或减小该问题带来的危害。

限制最大路径距离为15（16表不可达）
当路由表发生变化时就立即发送更新报文（即“触发更新”），而不仅是周期性发送
让路由器记录收到某特定路由信息的接口，而不让同一路由信息再通过此接口反方向发送（即“水平分割”）

6.3 开放最短路径优先OSPF的基本工作原理

开放最短路径优先OSPF，是为克服RIP的缺点在1989年开发出来的

“开放”表明OSPF协议不是受某一家厂商控制，而是公开发表的
“最短路径优先”是因为使用了Dijkstra提出的最短路径算法SPF

OSPF是基于链路状态的，而不像RIP那样是基于距离向量的

OSPF采用SPF算法计算路由，从算法上保证了不会产生路由环路

OSPF不限制网络规模，更新效率高，收敛速度快

链路状态是指本路由器都和哪些路由器相邻，以及相应链路的“代价”

“代价”用来表示费用、距离、时延、带宽等等，这些都由网络管理人员来决定

OSPF相邻路由器之间通过交互问候分组，建立和维护邻居关系

Hello分组封装在IP数据报中，发往组播地址224.0.0.5
发送周期为10秒
40秒未收到来自邻居路由器的Hello分组，则认为该邻居路由器不可达

使用OSPF的每个路由器都会产生链路状态通告LSA。LSA中包含以下内容：

直连网络的链路状态信息
邻居路由器的链路状态信息

LSA被封装在链路状态更新分组LSU中，采用洪泛法发送

使用OSPF的每个路由器都有一个链路状态数据库LSDB，用于存储LSA

通过各路由器洪泛发送封装有自己LSA的LSU分组，各路由器的LSDB最终将达到一致

使用OSPF的各路由器基于LSDB进行最短路径优先SPF计算，构建出各自到达其他各路由器的最短路径，即构建各自的路由表

OSPF有以下五种分组类型：

问候分组：用来发现和维护邻居路由器的可达性
数据库描述分组：向邻居路由器给出自己的链路状态数据库中的所有链路状态信息的摘要信息
链路状态请求分组：向邻居路由器请求发送某些链路状态项目的详细信息
链路状态更新分组：路由器使用这种分组将其链路状态进行洪泛发送，即用洪泛法对全网更新链路状态
链路状态确认分组：这是对链路状态更新分组的确认分组

OSPF在多点接入网络中路由器邻居关系的建立

选举指定路由器DR和备用的指定路由器BDR
所有的非DR/BDR只与DR/BDR建立邻居关系
非DR/BDR之间通过DR/BDR交换信息

为了使OSPF能够用于规模很大的网络，OSPF把一个自治系统再划分为若干个更小的范围，叫做区域

区域内路由器IR:R1,R2,R8,R9

区域边界路由器ABR:R3,R4,R7

主干路由器BBR:R3,R4,R5,R6,R7

自治系统边界路由器ASBR:R6

6.4 边界网关协议BGP的基本工作原理

内部网关协议IGP

设法使分组在一个自治系统内尽可能有效地从源网络传输到目的网络
无需考虑自治系统外部其他方面的策略

外部网关协议EGP

在不同自治系统内，度量路由的“代价”可能不同，因此，对于自治系统之间的路由选择，使用“代价”作为度量来寻找最佳路由是不行的
自治系统之间的路由选择必须考虑相关策略（政治、经济、安全等）
BGP只能是力求寻找一条能够到达目的网络且比较好的路由，而并非要寻找一条最佳路由

在配置BGP时，每个自治系统的管理员要选择至少一个路由器作为该自治系统的“BGP发言人”

不同自治系统的BGP发言人要交换路由信息，首先必须建立TCP连接，端口号为179

在此TCP连接上交换BGP报文以建立BGP会话
利用BGP会话交换路由信息（如：增加新的路由；撤销过时的路由；报告出错的情况）
使用TCP连接交换路由信息的两个BGP发言人，彼此称为对方的邻站或对等站

BGP发言人除了运行BGP外，还必须运行自己所在自治系统所使用的的内部网关协议IGP，例如OSPF或RIP

BGP发言人交换网络可达性信息（要到达某个网络所要经过的一系列自治系统）

当BGP发言人互相交换了网络可达性的信息后，各BGP发言人就根据所采用的的策略从收到路由信息中找出到达各自治系统的较好的路由。也就是构造出树形结构、不存在回路的自治系统连通图

BGP-4有以下4种报文：

OPEN（打开）报文：用来与相邻的另一个BGP发言人建立关系，使通信初始化
UPDATE（更新）报文：用来通告某一路由的信息，以及列出要撤销的多条路由
KEEPALIVE（保活）报文：用来周期性地证实邻站的连通性
NOTIFICATION（通知）报文：用来发送检测到的差错

7.IPv4数据报的首部格式

版本

占4比特，表示IP协议的版本、通信双方使用的IP协议的版本必须一致，目前广泛使用的IP协议版本号为4（即IPv4）

首部长度

占4比特，表示IP数据报首部的长度。该字段的取值以4字节为单位

最小十进制取值5，表示IP数据报首部只有20字节固定部分

最大十进制取值15，表示IP数据报首部包含20字节固定部分和最大40字节可变部分

可选字段

长度从1个字节到40个字节不等。用来支持排错、测量及安全等措施

可选字段增加了IP数据报的功能，但这同时也使得IP数据报的首部长度成为可变的。这就增加了每一个路由器处理IP数据报的开销。实际上可选字段很少被使用

填充字段

确保首部长度为4字节的正数倍。使用全0进行填充

区分服务

占8比特，用来获得更好的服务

总长度

占16比特，表示IP数据报的总长度（首部+数据载荷）。最大取值为十进制的65535，以字节为单位

标识

占16比特，属于同一个数据报的各分片数据报应该具有相同的标识。IP软件维持一个计数器，每产生一个数据报，计数器值加1，并将此值赋给标识字段

片偏移

占13比特，指出分片数据报的数据载荷部分偏移其在原数据报的位置有多少个单位。片偏移以8个字节为单位

生存时间TTL

占8个比特，表示IP数据报的生存时间

最初以秒为单位，最大生存周期为255秒；路由器转发IP数据报时，将IP数据报首部中的该字段减去IP数据报在本路由器上所耗费的时间，若不为0就转发，否则就丢弃

现在以“跳数”为单位，路由器转发IP数据报时，将IP数据报首部中的该字段减1，若不为0就转发，否则就丢弃

协议

占8比特，指明IPv4数据报的数据部分是何种协议数据单元

首部检验和

占16比特，用来检验首部在传输过程中是否出现差错。比CRC检验码简单，称为因特网检验和。由于IP层本身并不提供可靠传输的服务，并且计算首部校验和是一项耗时的操作，因此在IPv6中，路由器不再计算首部校验和，从而更快转发IP数据报

源IP地址和目的IP地址

各占32比特，用来填写发送该IP数据报的源主机的IP地址和接收该IP数据报的目的主机的IP地址

8.网际控制报文协议ICMP

为了更有效地转发IP数据报和提高交付成功的机会，在网际层使用网际控制报文协议ICMP

主机或路由器使用ICMP来发送差错报告报文和询问报文

ICMP报文被封装在IP数据报中发送

ICMP差错报告报文共有以下五种：

终点不可达
源点抑制

当路由器或主机由于拥塞而丢弃数据报时，就向源点发送源点抑制报文，使源点知道应当把数据报的发送速率放慢

时间超过

当路由器收到一个目的IP地址不是自己的IP数据报，会将其生存时间TTL字段的值减1

若结果不为0，则将该IP数据报转发出去；若结果为0，除丢弃该IP数据报外，还要向源点发送时间超过报文

另外，当终点在预先规定的时间内不能收到一个数据报的全部数据报片时，就把已收到的数据报片都丢弃，也会向源点发送时间超过报文

参数问题

当路由器或目的主机收到IP数据报后，根据其首部中的检验和字段发现首部在传输过程中出现了误码，就丢弃该数据报，并向源点发送参数问题报文

改变路由（重定向）

路由器把改变路由报文发送给主机，让主机知道下次应将数据报发送给另外的路由器（可通过更好的路由）

以下情况不应该发送ICMP差错报告报文：

对ICMP差错报告报文不再发送ICMP差错报告报文
对第一个分片的数据报片的所有后续数据报片都不发送ICMP差错报告报文
对具有多播地址的数据报都不发送ICMP差错报告报文
对具有特殊地址（如127.0.0.0或0.0.0.0）的数据报不发送ICMP差错报告报文

常用的ICMP询问报文有以下两种：

回送请求和回答

ICMP回送请求报文是由主机或路由器向一个特定的目的主机发出的询问

收到此报文的主机必须给源主机或路由器发送ICMP回送回答报文

这种询问报文用来测试目的站是否可达及了解其有关状态

时间戳请求和回答

ICMP时间戳请求报文是请某个主机或路由器回答当前的日期和时间

在ICMP时间戳回答报文中有一个32位的字段，其中写入的正数代表从1900年1月1日起到当前时刻一共有多少秒

ICMP应用举例

分组网监探测PING
- 用来测试主机或路由器间的连通性
- 应用层直接使用网际层的ICMP（没有通过运输层的TCP或UDP）
- 使用ICMP回送请求和回答报文
跟踪路由
- 用来测试IP数据报从源主机到达目的主机要经过哪些路由器
- Windows版本
  - tracert命令
  - 应用层直接使用网际层ICMP
  - 使用了ICMP回送请求和回答报文以及差错报告报文
- Unix版本
  - traceroute命令
  - 在运输层使用UDP协议
  - 仅使用ICMP差错报告报文

9.虚拟专用网VPN与网络地址转换NAT

9.1 虚拟专用网VPN

利用公用的因特网作为本机构各专用网之间的通信载体，这样的专用网又称为虚拟专用网

由于IPv4地址的紧缺，一个机构能够申请到IPv4地址数量往往远小于本机构所拥有的主机数量。因此，虚拟专用网中的各主机所分配的地址应该是本机构可自由分配的专用地址，而不是需要申请的、在因特网上使用的公有地址

同一机构内不同部门的内部网络所构成的虚拟专用网VPN又称为内联网VPN

有时一个机构的VPN需要有某些外部机构（合作伙伴）参加进来。这样的VPN就称为外联网VPN

在外地工作的员工需要访问公司内部的专用网络时，只要在任何地点接入到因特网，运行驻留在员工PC中的VPN软件，在员工的PC和公司的主机之间建立VPN隧道，即可访问专用网络中的资源。这种VPN称为远程接入VPN

9.2 网络地址转换NAT

虽然因特网采用了无分类编址方式来减缓IPv4地址空间耗尽的速度，但由于因特网用户数目的激增，特别是大量小型办公室网络和家庭网络接入因特网的需求不断增加，IPv4地址空间即将面临耗尽的危险仍然没有被解除

由于绝大多数的网络应用都是使用运输层协议TCP或UDP来传送数据，因此可以利用运输层的端口号和IP地址一起进行转换

这样，用一个全球IP地址就可以使多个拥有本地地址的主机同时和因特网上的主机进行通信。这种将端口号和IP地址一起进行转换的技术叫做网络地址与端口号转换NAPT

对于一些P2P网络应用，需要外网主机主动与内网主机进行通信，在通过NAT时会遇到问题，需要网络应用自己使用一些特殊的NAT穿越技术来解决问题

另外，由于NAT对外屏蔽了内网主机的网络地址，能为内网的主机提供一定的安全保护