【计算机网络】— 五层协议模型计算机网络复习篇章开始啦～说到这个计算机网络的基础，那当然要从基础的 OSI 模型说起。

前言

计算机网络复习篇章开始啦～说到这个计算机网络的基础，那当然要从基础的 OSI 模型说起。

OSI（Open System Interconnect）—— 即开放式系统互联。

一般我们都叫 OSI 参考模型，是 ISO 组织在 1985 年研究的网络互联模型。该体系结构标准定义了网络互联的七层框架

物理层、数据链路层、网络层、传输层、会话层、表示层和应用层

在这一框架下进一步详细规定了每一层的功能，以实现开放系统环境中的互连性、互操作性和应用的可移植性。

OSI 参考模型

OSI 参考模型有 7 层，具体如上图所示。

发送端从最高层开始，从上到下按顺序传输数据，每一层接收到由上层处理的数据时，添加该层的首部并可能会对数据进行处理（如表示层）。

而接收端则将顺序反过来，从首层开始，将数据的内容与该层对应的首部拆开，传给上一层。

而对于互联网的分层，有许多不同的分法，刚刚说的 OSI 模型的 7 层，还有 4 层等，但是我们学习理解的话，个人认为 5 层会比较好理解。

五层协议模型分层：

应用层 / 传输层 / 网络层 / 链路层 / 物理层

而不管多少层，每一层的目的其实都是为用户与服务器的数据通信添砖加瓦。

而为了实现这些目的，无规矩不成方圆，所以需要制定大家都必须遵循的规则，这些规则，放在计算机网络里，就叫做协议。

而互联网的每一层，都制定了很多协议，所以下面我们介绍各个层的核心时，其实就是介绍这个层的主要协议。

那么每一层到底有什么协议，又有什么作用呢？我们从最底层往上看。

物理层

我们知道，电脑之间进行联网，必不可少的是什么呢？

是光缆 / 电缆 / 双绞线 / 无线电波等。

所以，这些必不可少的东西就组成了物理层：

负责把电脑网络组装起来的物理手段，规定了网络的一些电力特性，主要作用是用来传输 0 和 1 的电信号

链路层

定义

从上一层我们得到了物理硬件发出的 0 1 信号波，可是单纯的 0 1 并没有任何意义，这时必须定义一个解码规则：多少个电信号为一组呢？每个信号位的意义是什么？

所以，这样就能得出链路层的功能之一：

位于物理层的上方，用于确定 0 和 1 的分组方式

以太网协议

而这种规定的分组也是一种协议, 名字叫做以太网协议（Ethernet）。

以太网协议规定：

一组电信号构成一个数据包，叫做"帧"（Frame）。每一帧分成两个部分：标头（Head）和数据（Data）。

帧的组成	内容	限制大小
标头	包含数据包一些说明选项，比如：发送者 / 接收者 / 数据类型等	固定的 18 个字节
数据	我们要发送的数据包的具体内容	最短 46 字节，最长 1500 字节

所以从这些规定我们可以得出，一帧最短是 64 个字节，最长是 1618 个字节。如果我们要发送的数据很大，就需要把数据分割成多个帧来进行发送。

帧的组成中的数据我们已经知道了，那么标头中的数据呢？刚刚说到，标头中包含了发送者和接收者的信息，那么问题来了，这些信息是如何标标识的呢？

MAC 地址

以太网规定，连入网络的所有设备，都必须具有"网卡"接口。我们的数据包必须是从一块网卡，传送到另一块网卡。

网卡的地址，就是数据包的发送地址和接收地址，这叫做 MAC 地址

每块网卡出厂的时候，都有一个全世界独一无二的 MAC 地址，MAC 地址的长度呢，是 48 个二进制位，通常用 12 个十六进制数来表示。

如上图所示：前 6 个十六进制数是厂商编号，后 6 个是该厂商的网卡流水号。有了 MAC 地址，就可以定位网卡和数据包的来源和目的地啦。

知道了地址，我们现在来思考两个问题：

一块网卡如何知道另一块网卡的 MAC 地址（ ARP 协议，之后介绍），我们需要知道的是：以太网数据包必须知道接收方的 MAC 地址，才能发送数据。
有了目标 MAC 地址，如何准确的把数据发送给接收方？

对于第二个问题，这里采用了一种叫做 “广播” 的很原始的方式来进行介绍（意思就是还有很多种方式啦～～广播只是其中一种～～）：

广播

以太网协议不是把数据包准确送到接收方，而是向本网络内所有计算机发送，让每台计算机自己判断，是否为接收方。

如上图所示：

1 号计算机想要向 2 号计算机发送一个数据包，发送之后，3 4 5 号计算机也会收到同样的数据包，这时计算机就会读取数据包的标头，找到接收方的 MAC 地址，与自身的 MAC 地址相匹配，相同则接受处理，否则就丢弃。

这个过程就叫做：广播

所以，有了这几个内容：

数据包的定义
网卡的唯一标志符（设备的 MAC 地址）
数据在网络中的发送方式（广播 /路由等）

链路层就可以在多台计算机之间传输数据了。

网络层

刚刚我们知道了，链路层的以太网协议是根据 MAC 地址来发送数据的，所以但从理论上来说：坐标深圳的网卡就能找到纽约的网卡啦（技术上是可行的）

但是这会有一个什么问题呢？

效率低：如果以太网采用广播的形式发包，该网络下的所有子计算机人手一个包，效率低下
局限：如果以太网采用广播方式发包，那么数据的发送就局限在了发送者的子网络中，所以，如果两台计算机不在同一个子网络，广播就过不去咯～～（局限但合理，否则互联网上每一台计算机都会收到所有包，你想想那个画面？？）

互联网数无数个子网络组成的巨型网络。

所以，有问题就要有解决手段，这时，网络层的作用就体现出来啦～

网络层：作用是引进一套新的地址，使得我们能够区分不同的计算机是否属于同一个子网络。这套地址就叫做"网络地址"，简称"网址"。

所以～ "网络层"出现以后，每台计算机有了两种地址，一种是 MAC 地址，另一种是网络地址。两种地址之间没有任何联系，MAC 地址是绑定在网卡上的，网络地址则是管理员分配的，它们只是随机组合在一起。

网络地址帮助我们确定计算机所在的子网络。

MAC 地址则将数据包送到该子网络中的目标网卡。

因此，从逻辑上可以推断，必定是先处理网络地址，再处理 MAC 地址。

直到有了网络地址，那么问题又又又来了，如何处理网络地址，网络地址有什么规则（协议）？

IP 协议

求知的心情非常强烈，那我就告诉你

规定网络地址的协议，叫做 IP 协议！（有没有觉得熟悉了起来？）

而 IP 协议定义的地址，就叫做 IP 地址。

IP 协议目前我们用的比较广泛的有两种：

版本	格式	举例
IPv4	32个二进制位组成	192.168.20.99 11000000.10101000.10100000.11000110
IPv6

互联网上的每一台计算机，都会分配到一个 IP 地址。这个地址分成两个部分，前一部分代表网络，后一部分代表主机。

下面以 IPv4 地址为例：

比如，IP 地址 172.16.254.1 ，这是一个 32 位的地址，假定它的网络部分是前 24 位（172.16.254），那么主机部分就是后 8 位（最后的那个1）。处于同一个子网络的电脑，它们 IP 地址的网络部分必定是相同的，也就是说 172.16.254.2 应该与 172.16.254.1 处在同一个子网络。

但是，问题在于单单从 IP 地址，我们无法判断网络部分。还是以 172.16.254.1 为例，它的网络部分，到底是前 24 位，还是前 16 位，甚至前 28 位，从 IP 地址上是看不出来的。

那么，怎样才能从 IP 地址，判断两台计算机是否属于同一个子网络呢？这就要用到另一个参数 子网掩码

所谓"子网掩码"，就是表示子网络特征的一个参数。它在形式上等同于 IP 地址，也是一个 32 位二进制数字，它的网络部分全部为 1 ，主机部分全部为 0 。

比如，IP 地址 172.16.254.1 ，如果已知网络部分是前 24 位，主机部分是后 8 位，那么子网络掩码就是 11111111.11111111.11111111.00000000 ，写成十进制就是 255.255.255.0。

知道子网掩码，我们就能判断，任意两个 IP 地址是否处在同一个子网络。方法是将两个 IP 地址与子网掩码分别进行 AND 运算（两个数位都为 1，运算结果为 1，否则为 0 ），然后比较结果是否相同，如果是的话，就表明它们在同一个子网络中，否则就不是。

举个🌰，已知 IP 地址 172.16.254.1 和 172.16.254.233 的子网掩码都是 255.255.255.0，请问它们是否在同一个子网络？两者与子网掩码分别进行 AND 运算，结果都是 172.16.254.0，因此它们在同一个子网络。

所以这里我们就可以得出结论啦～～

IP 协议的作用主要有两个：

1. 为每一台计算机分配 IP 地址 2. 确定哪些地址在同一个子网络。

IP 数据包

根据 IP 协议发送的数据，就叫做 IP 数据包。所以数据包中其中必定包括 IP 地址信息。

但是前面说过，以太网数据包只包含 MAC 地址，并没有 IP 地址的栏位。那么是否需要修改数据定义，再添加一个栏位呢？

回答是不需要，我们可以把 IP 数据包直接放进以太网数据包的"数据"部分，因此完全不用修改以太网的规格。

这就是互联网分层结构的好处：上层的变动完全不涉及下层的结构。

具体来说，IP 数据包也分为"标头"和"数据"两个部分。

"标头"部分主要包括版本、长度、IP 地址等信息，"数据"部分则是 IP 数据包的具体内容。它放进以太网数据包后，以太网数据包就变成了下面这样。

ARP 协议

因为 IP 数据包是放在以太网数据包里发送的，所以我们必须同时知道两个地址：一是对方的 MAC 地址，二是对方的 IP 地址。

通常情况下，对方的 IP 地址是已知的（之后详细介绍），但是我们不知道它的 MAC 地址。

所以，我们需要一种机制，能够从 IP 地址得到 MAC 地址。

这个机制需要分成 2 种情况来处理：

两台主机不在同一个子网络

这种情况事实上没有办法得到对方的 MAC 地址，只能把数据包传送到两个子网络连接处的"网关"（gateway），让网关去处理。
两台主机在同一个子网络内

这时就用到了 ARP 协议啦，ARP 协议也是发出一个数据包（包含在以太网数据包中），其中包含它所要查询主机的 IP 地址，在对方的 MAC 地址这一栏，填的是 FF:FF:FF:FF:FF:FF ，表示这是一个"广播"地址。它所在子网络的每一台主机，都会收到这个数据包，从中取出 IP 地址，与自身的 IP 地址进行比较。如果两者相同，都做出回复，向对方报告自己的 MAC 地址，否则就丢弃这个包。

所以这样我们就可以得到：有了 ARP 协议之后，我们就可以得到同一个子网络内的另一台主机的 MAC 地址，可以把数据包发送到任意一台主机之上了。

传输层

前置的链路层和网络层，让我们得到了 MAC 地址和 IP 地址，这时我们已经可以在互联网上任意两台主机上建立通信。

那么接下来的问题是，同一台主机上有许多程序都需要用到网络，比如，你一边浏览网页，一边与朋友在线聊天。当一个数据包从互联网上发来的时候，你怎么知道，它是表示网页的内容，还是表示在线聊天的内容？

也就是说，我们还需要一个参数，表示这个数据包到底供哪个程序（进程）使用。这个参数就叫做"端口"（port），它其实是每一个使用网卡的程序的编号。每个数据包都发到主机的特定端口，所以不同的程序就能取到自己所需要的数据。

"端口"是 0 到 65535 之间的一个整数，正好 16 个二进制位。0 到 1023 的端口被系统占用，用户只能选用大于 1023 的端口。不管是浏览网页还是在线聊天，应用程序会随机选用一个端口，然后与服务器的相应端口联系。

所以这样就能引申出传输层的功能啦：

传输层 —— 建立"端口到端口"的通信。

相比之下，"网络层"的功能是建立"主机到主机"的通信。只要确定主机和端口，我们就能实现程序之间的交流。因此，Unix 系统就把主机+端口，叫做"套接字"（socket）。有了它，就可以进行网络应用程序开发了。

所以这时我们需要端口号，就需要把端口号放到数据包中，这时就需要新的协议啦～

UDP 协议

UDP 数据包，也是由"标头"和"数据"两部分组成。

"标头"部分主要定义了发出端口和接收端口，"数据"部分就是具体的内容。

然后，把整个 UDP 数据包放入 IP 数据包的"数据"部分，而前面说过，IP 数据包又是放在以太网数据包之中的，所以整个以太网数据包现在变成了下面这样：

UDP 数据包非常简单，"标头"部分一共只有 8 个字节，总长度不超过 65,535 字节，正好放进一个 IP 数据包。

TCP协议

UDP协议的优点是比较简单，容易实现，但是缺点是可靠性较差，一旦数据包发出，无法知道对方是否收到。

为了解决这个问题，提高网络可靠性， TCP 协议就诞生了，可以近似认为，它就是有确认机制的UDP协议，每发出一个数据包都要求确认。如果有一个数据包遗失，就收不到确认，发出方就知道有必要重发这个数据包了。

因此，TCP 协议能够确保数据不会遗失。它的缺点是过程复杂、实现困难、消耗较多的资源。

TCP 数据包和 UDP 数据包一样，都是内嵌在 IP 数据包的"数据"部分。TCP 数据包没有长度限制，理论上可以无限长，但是为了保证网络的效率，通常 TCP 数据包的长度不会超过 IP 数据包的长度，以确保单个 TCP 数据包不必再分割。

应用层

应用层是最接近用户的一层，它收到传输层的数据并进行解读，但是呢，不同应用的数据五花八门，必须事先规定好格式，否则根本无法解读。所以应用层的作用就是

规定应用程序的数据格式

举例说明，TCP 协议可以为各种各样的程序传递数据，比如 Email、WWW、FTP 等等。

那么，必须有不同协议规定电子邮件、网页、FTP 数据的格式，这些应用程序协议就构成了"应用层"。

这一层的数据就放在 TCP 数据包的"数据"部分。因此，现在的以太网的数据包就变成下面这样。

到这里，整个互联网的五层协议模型就讲完啦～～，之后还会对里面一些比较重要的协议做详细解读～～