网络协议(一):网络模型

193 阅读20分钟

网络编程的本质是多台计算机之间的数据交换。现在的网络编程基本上都是基于请求/响应方式的,也就是一个设备发送请求数据给另外一个,然后接收另一个设备的反馈。在网络编程中,发起连接程序,也就是发送第一次请求的程序,被称作客户端(Client),等待其他程序连接的程序被称作服务器(Server)。客户端程序可以在需要的时候启动,而服务器为了能够时刻相应连接,则需要一直启动。

例如以打电话为例,首先拨号的人类似于客户端,接听电话的人必须保持电话畅通类似于服务器。连接一旦建立以后,客户端和服务器端就可以进行数据传递了。

网络编程中两个主要的问题:

  1. 一个是如何准确的定位网络上一台或多台主机

  2. 另一个就是找到主机后如何可靠高效的进行数据传输

  • 在 TCP/IP 协议中 IP 层主要负责网络主机的定位,数据传输的路由,由 IP 地址可以确定 Internet 上唯一的一台主机。

  • 而 TCP 层则提供面向应用的可靠(TCP)的或非可靠(UDP)的数据传输机制,这是网络编程的主要对象,一般不需要关心 IP 层是如何处理数据的。

  • 目前较为流行的网络编程模型是客户机/服务器(C/S)结构。即通信双方一方作为服务器等待客户提出请求并予以响应。客户则在需要服务时向服务器提出申请。服务器一般作为守护进程始终运行,监听网络端口,一旦有客户请求,就会启动一个服务进程来响应该客户,同时自己继续监听服务端口,使后来的客户也能及时得到服务。

网络协议是什么?

  • 在计算机网络要做到井井有条的交换数据,就必须遵守一些事先约定好的规则,比如交换数据的格式、是否需要发送一个应答信息。这些规则被称为网络协议。

计算机网络里,有两种常见的参考模型即:

  • OSI 参考模型

  • TCP/IP 参考模型

OSI 七层参考模型

在这里插入图片描述

最早的网络模型,分为七层,从下到上依次为物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。

了解就行,市面上使用更多的还是 TCP/IP 网络参考模型

TCP/IP 网络参考模型

TCP/IP 是一个协议族,是因为 TCP/IP 协议包括 HTTP、FTP、TCP、UDP、IP、ICMP 等许多协议。这些协议一起称为 TCP/IP 协议。

在这里插入图片描述

由上往下分别为:应用层,传输层,网络层,数据链路层,物理层。

TCP/IP 五层模型
应用层HTTP、FTP、TFTP、SMTP、SNMP、DNS
传输层TCP、UDP、SCTP
网络层ICMP、IGMP、IP
数据链路层由底层网络定义
物理层由底层网络定义

一、应用层

TCP/IP 模型将 OSI 参考模型中的会话层和表示层的功能合并到应用层实现。这一层主要的代表有 HTTP 协议

HTTP 协议

HTTP 协议是基于 TCP 的,流媒体、网络电话等是基于 UPD 的。

网络协议(二):HTTP 协议

HTTPS 协议

HTTP + SSL = HTTPS

网络协议(三):HTTPS 协议

TCP/IP、HTTP、TCP 三者的关系

TCP/IP 是网络参考模型,是一系列协议的集合,主要解决数据如何在网络中传输。

HTTP 是应用层协议,定义的是传输数据的内容以及格式的规范。

TCP 是传输层协议,定义的是数据传输和连接方式的规范。

HTTP 和 HTTPS 区别

  • HTTPS 是加密传输协议,HTTP 是明文传输协议

  • HTTPS 需要用到 SSL 证书,而 HTTP 不用

  • HTTPS 比 HTTP 更加安全,对搜索引擎更友好

  • HTTPS 标准端口 443,HTTP 标准端口 80

  • HTTPS 在浏览器显示绿色安全锁,HTTP 没有显示

二、传输层

在 TCP/IP 模型中,传输层的功能是使源端主机和目标端主机上的对等实体可以进行会话。在传输层定义了两种服务质量不同的协议。即:TCP 和 UDP。

TCP

TCP(Transmission Control Protocol,传输控制协议),是一种面向连接的、可靠的、基于字节流的传输层通信协议,由 IETF 的 RFC 793 定义。TCP 是面向连接的、可靠的流协议,流就是指不间断的数据结构。

当一台计算机想要与另一台计算机通讯时,两台计算机之间的通信需要畅通且可靠,这样才能保证正确收发数据。例如,当你想查看网页或查看电子邮件时,希望完整且按顺序查看网页,而不丢失任何内容。当你下载文件时,希望获得的是完整的文件,而不仅仅是文件的一部分,因为如果数据丢失或乱序,都不是你希望得到的结果,于是就用到了 TCP。

先清楚一个概念 HTTP 请求与 TCP 连接之间的关系,在客户端向服务端请求和返回的过程中,是需要去创建一个 TCP connection,因为 HTTP 是不存在连接这样一个概念的,它只有请求和响应这样一个概念,请求和响应都是一个数据包,中间要通过一个传输通道,TCP 就在两台计算机之间提供了一条虚拟的、逻辑上的数据传输通道。TCP 连接在创建的时候是有一个三次握手(三次网络传输)这样一个消耗在的。

浏览器都是建立在 TCP 协议上的。

TCP 连接过程(3次握手)

简单介绍就是:设标志位,发序列号。

1、第一次握手

  • 客户端(Client)

    • 发送一个 SYN 报文段给服务器(Server),其中 SYN 标志位被设置为 1,表示这是一个连接请求。

    • 随机生成一个初始序列号(seq=x),并将其放入 TCP 头部中的序列号字段。

    • 进入 SYN_SENT 状态,等待服务器的确认。

  • 服务器(Server)

    • 收到客户端的 SYN 报文段后,知道客户端请求建立连接。

2、第二次握手

  • 服务器(Server)

    • 回复一个 SYN + ACK 报文段给客户端,其中 SYN 标志位也被设置为 1,表示服务器也同意建立连接。

    • ACK 标志位被设置为 1,表示这是一个确认报文段。

    • 确认号(ack)字段被设置为客户端的初始序列号加 1(ack=x+1),以确认收到客户端的 SYN 报文段。

    • 随机生成一个自己的初始序列号(seq=y),并将其放入 TCP 头部中的序列号字段。

    • 进入 SYN_RCVD 状态,等待客户端的确认。

  • 客户端(Client)

    • 收到服务器的 SYN + ACK 报文段后,知道服务器已经同意建立连接。

3、第三次握手

  • 客户端(Client)

    • 发送一个 ACK 报文段给服务器,以确认收到服务器的 SYN + ACK 报文段。

    • ACK 标志位被设置为 1。

    • 确认号(ack)字段被设置为服务器的初始序列号加 1(ack=y+1)。

    • 序列号字段可以设置为客户端的初始序列号加 1(seq=x+1),但这个序列号在此确认报文段中并不重要,因为它不包含数据。

    • 客户端进入 ESTABLISHED 状态,表示连接已经建立。

  • 服务器(Server)

    • 收到客户端的 ACK 报文段后,也进入 ESTABLISHED 状态,表示连接已经成功建立。

总结:

  • 第一次握手:客户端发送(SYN=1, seq=x),进入 SYN_SENT 状态。

  • 第二次握手:服务器回复(SYN=1, ACK=1, seq=y, ack=x+1),进入 SYN_RCVD 状态。

  • 第三次握手:客户端发送(ACK=1, seq=x+1, ack=y+1),进入 ESTABLISHED 状态;服务器收到后也进入 ESTABLISHED 状态,完成连接建立。

为什么使用三次握手? 为了防止已失效的连接请求报文段突然又传送到了服务端,因而产生错误 ——谢希仁著《计算机网络》第四版

谢希仁版《计算机网络》中的例子是这样的,“已失效的连接请求报文段”的产生在这样一种情况下:client发出的第一个连接请求报文段并没有丢失,而是在某个网络结点长时间的滞留了,以致延误到连接释放以后的某个时间才到达server。本来这是一个早已失效的报文段。但server收到此失效的连接请求报文段后,就误认为是client再次发出的一个新的连接请求。于是就向client发出确认报文段,同意建立连接。假设不采用“三次握手”,那么只要server发出确认,新的连接就建立了。由于现在client并没有发出建立连接的请求,因此不会理睬server的确认,也不会向server发送数据。但server却以为新的运输连接已经建立,并一直等待client发来数据。这样,server的很多资源就白白浪费掉了。采用“三次握手”的办法可以防止上述现象发生。例如刚才那种情况,client不会向server的确认发出确认。server由于收不到确认,就知道client并没有要求建立连接。”主要目的防止server端一直等待,浪费资源。

TCP 断开连接(4次挥手)

1、第一次挥手

  • 客户端(Client):

    • 客户端发送一个 FIN 报文段给服务器(Server),其中 FIN 标志位被设置为 1,表示客户端想要关闭连接。

    • 报文中包含一个序列号(seq=u),表示发送的 FIN 报文段的序列号。

    • 客户端进入 FIN_WAIT_1 状态,等待服务器的确认。

2、第二次挥手

  • 服务器(Server):

    • 服务器收到客户端的 FIN 报文段后,发送一个 ACK 报文段给客户端作为确认。

    • ACK 标志位被设置为 1,表示这是一个确认报文段。

    • 确认号(ack)字段被设置为客户端 FIN 报文段的序列号加 1(ack=u+1),以确认收到客户端的 FIN 报文段。

    • 序列号(seq)字段为服务器选择的某个值(假设为 v),表示服务器发送的 ACK 报文段的序列号。

    • 服务器进入 CLOSE_WAIT 状态,表示服务器已经同意关闭连接,但还可能需要发送一些数据给客户端。

  • 客户端(Client):

    • 客户端收到服务器的 ACK 报文段后,进入 FIN_WAIT_2 状态,继续等待服务器发送 FIN 报文段。

3、第三次挥手

  • 服务器(Server):

    • 当服务器完成数据的发送后,会发送一个 FIN 报文段给客户端,表示服务器也想要关闭连接。

    • FIN 标志位被设置为 1。

    • 序列号(seq)字段为服务器发送的最后一个数据包的序列号之后的值(假设为w)。

    • 确认号(ack)字段仍然保持为客户端 FIN 报文段的序列号加 1(ack=u+1),表示服务器仍然确认客户端的 FIN 报文段。

    • 服务器进入 LAST_ACK 状态,等待客户端的确认。

4、第四次挥手

  • 客户端(Client):

    • 客户端收到服务器的 FIN 报文段后,发送一个 ACK 报文段给服务器作为确认。

    • ACK 标志位被设置为1。

    • 确认号(ack)字段被设置为服务器 FIN 报文段的序列号加 1(ack=w+1),以确认收到服务器的 FIN 报文段。

    • 序列号(seq)字段为客户端之前发送的 ACK 报文段的序列号加 1(或保持为 u+1,因为 ACK 报文段通常不包含数据)。

    • 客户端进入 TIME_WAIT 状态,等待一段时间(通常是 2MSL,即两倍的最大报文段寿命),以确保服务器收到了 ACK 报文段。

  • 服务器(Server):

    • 服务器收到客户端的 ACK 报文段后,进入 CLOSED 状态,表示连接已经完全关闭。
  • 客户端(Client):

    • 在 TIME_WAIT 状态等待 2MSL 时间后,客户端进入 CLOSED 状态,表示连接也已经完全关闭。这个等待时间是为了确保网络中的旧报文段已经过期,防止它们被错误地用于此连接。

总结:

  • 第一次挥手:客户端发送 FIN 报文段,进入 FIN_WAIT_1 状态。

  • 第二次挥手:服务器发送 ACK 报文段确认,进入 CLOSE_WAIT 状态;客户端进入 FIN_WAIT_2 状态。

  • 第三次挥手:服务器发送 FIN 报文段,进入 LAST_ACK 状态。

  • 第四次挥手:客户端发送 ACK 报文段确认,进入 TIME_WAIT 状态;服务器进入 CLOSED 状态。客户端在 TIME_WAIT 状态等待 2MSL 后,也进入 CLOSED 状态。

为什么需要四次挥手?

TCP 是双向的,所以需要在两个方向分别关闭,每个方向的关闭又需要请求和确认,所以一共就 4 次。

TCP 3 次握手和 4 次挥手概述

3 次握手:

  • 用于建立连接,确保数据同步与可靠性;

  • 等于是你在不认识我的情况下打我的电话让我来面试

    • 面试官(sss):喂?是xxx吗?我是sss,我想约你面试

    • 求职者(xxx):哦,你是sss啊,要约我面试,可以啊

    • 面试官(sss):那好,到时间就来面试吧

  • 过程:

    • 客户端发送报文表示想要建立连接

    • 服务端给客户端发送一个报文表示收到了客户端的请求

    • 客户端发送确认报文,双方成功建立连接

4 次挥手

  • 用于断开连接,保证双方数据传输完毕后安全关闭。

  • 等于是我在上家公司辞职了

    • 我找老板办理离职,

    • 老板说可以,

    • 老板接着给我办理离职,

    • 我签完字交接完才可以走

  • 过程:

    • 客户端发送报文表示想要关闭连接

    • 服务端给客户端发送一个报文表示收到了客户端的请求

    • 服务端发送报文表示想要关闭连接

    • 客户端发送确认报文,等待一段时间后关闭连接

TCP特点
  1. 面向连接,指发送数据之前必须在两端建立连接。建立连接的方法是“三次握手”,这样能建立可靠的连接。建立连接,是为数据的可靠传输打下了基础

  2. 仅支持单播传输,每条 TCP 传输连接只能有两个端点,只能进行点对点的数据传输,不支持多播和广播传输方式

  3. 面向字节流,TCP 不像 UDP 那样一个个报文独立地传输,而是在不保留报文边界的情况下以字节流方式进行传输

  4. 可靠传输,对于可靠传输,判断丢包,误码靠的是 TCP 的段编号以及确认号。TCP 为了保证报文传输的可靠,就给每个包一个序号,同时序号也保证了传送到接收端实体的包的按序接收。然后接收端实体对已成功收到的字节发回一个相应的确认(ACK);如果发送端实体在合理的往返时延(RTT)内未收到确认,那么对应的数据(假设丢失了)将会被重传

  5. 提供拥塞控制,当网络出现拥塞的时候,TCP 能够减小向网络注入数据的速率和数量,缓解拥塞

  6. 提供全双工通信,TCP 允许通信双方的应用程序在任何时候都能发送数据,因为 TCP 连接的两端都设有缓存,用来临时存放双向通信的数据。当然,TCP 可以立即发送一个数据段,也可以缓存一段时间以便一次发送更多的数据段(最大的数据段大小取决于 MSS)

UDP

全称用户数据报协议,在网络中它与 TCP 协议一样用于处理数据包,是一种无连接的协议。

UDP特点
  1. 面向无连接,UDP 不需要和 TCP 一样在发送数据前进行三次握手建立连接,想发数据就可以开始发送了,并且也只是数据报文的搬运工,不会对数据报文进行任何拆分和拼接操作。在发送端,应用层将数据传递给传输层的 UDP 协议,UDP 只会给数据加一个 UDP 头标识下是 UDP 协议,然后就传递给网络层了;在接收端,网络层将数据传递给传输层,UDP 只去除 IP 和报文头就传递给应用层,不会任何拼接操作。

  2. 有单播、多播、广播的功能。UDP 不止支持 1 对 1 的传输方式,同样支持 1 对多,多对多,多对 1。

  3. UDP 是面向报文的。发送方的 UDP 对应用程序交下了的报文,在添加首部后就向下交付 IP 层。UDP 对应用层交下来的报文既不合并也不拆分,而是保留这些报文的边界。因此应用程序必须选择合适大小的报文。

  4. 不可靠性。不可靠性体现在无连接上,通信都不需要建立连接,想发就发,收到什么数据就传递什么数据,不会备份数据,发送数据也不关心对方是否已经正确接收到数据。UDP 没有拥塞控制,一直会以恒定的速度发送数据,所以网络环境不好时会导致丢包,优点是在某些实时性要求高的场景(比如电话会议)就需要使用 UDP 而不是 TCP。

  5. 头部开销小,传输报文时是很高效的。UDP 头部包含了以下几个数据:

    1) 两个 16 位的端口号,分别为源端口(可选字段)和目标端口;

    2) 整个数据报文的长度;

    3) 整个数据报文的检验和 IPV4(可选字段),该字段用于发现头部信息和数据中的错误;

    因此 UDP 的头部开销小,只有 8 字节,相比 TCP 的至少 20 字节要少得多,在传输报文时是很高效的。

UDP 缺点

提供数据包分组、组装和不能对数据包进行排序,即报文发送后,无法得知其是否安全完整到达

TCP 和 UDP 区别

  • TCP向上层提供面向连接的可靠服务 ,UDP向上层提供无连接不可靠服务。

  • 虽然 UDP 并没有 TCP 传输来的准确,但是也能在很多实时性要求高的地方有所作为

  • 对数据准确性要求高,速度可以相对较慢的,可以选用 TCP

在这里插入图片描述

  • 运行在TCP协议上的协议:

    • HTTP(Hypertext Transfer Protocol,超文本传输协议),主要用于普通浏览。

    • HTTPS(HTTP over SSL,安全超文本传输协议),HTTP协议的安全版本。

    • FTP(File Transfer Protocol,文件传输协议),用于文件传输。

    • POP3(Post Office Protocol, version 3,邮局协议),收邮件用。

    • SMTP(Simple Mail Transfer Protocol,简单邮件传输协议),用来发送电子邮件。

    • TELNET(Teletype over the Network,网络电传),通过一个终端(terminal)登陆到网络。

    • SSH(Secure Shell,用于替代安全性差的TELNET),用于加密安全登陆用。

  • 运行在UDP协议上的协议:

    • BOOTP(Boot Protocol,启动协议),应用于无盘设备。

    • NTP(Network Time Protocol,网络时间协议),用于网络同步。

    • DHCP(Dynamic Host Configuration Protocol,动态主机配置协议),动态配置IP地址。

三、网络层

网络互连层是整个 TCP/IP 协议栈的核心。它的功能是把分组发往目标网络或主机。同时,为了尽快地发送分组,可能需要沿不同的路径同时进行分组传递。因此,分组到达的顺序和发送的顺序可能不同,这就需要上层必须对分组进行排序。网络互连层定义了分组格式和协议,即 IP 协议(Internet Protocol )

IP协议

IP(Internet Protocol)协议的英文名直译就是:因特网协议。从这个名称我们就可以知道 IP 协议的重要性。在现实生活中,我们进行货物运输时都是把货物包装成一个个的纸箱或者是集装箱之后才进行运输,在网络世界中各种信息也是通过类似的方式进行传输的。

IP 协议规定了数据传输时的基本单元和格式。如果比作货物运输,IP 协议规定了货物打包时的包装箱尺寸和包装的程序。

除了这些以外,IP 协议还定义了数据包的递交办法和路由选择。同样用货物运输做比喻,IP 协议规定了货物的运输方法和运输路线。

网络上每一个节点都必须有一个独立的 Internet 地址(也叫做 IP 地址)。现在通常使用的 IP 地址是一个 32bit 的数字,也就是我们常说的 Ipv4 标准,这 32bit 的数字分成四组,也就是常见的 255.255.255.255 的样式。Ipv4 标准上,地址被分为五类,我们常用的是 B 类地址。需要注意的是 IP 地址是网络号+主机号的组合,这非常重要。

四、物理层

该层负责比特流在节点之间的传输,即负责物理传输,这一层的协议既与链路有关,也与传输的介质有关。通俗来说就是把计算机连接起来的物理手段。

五、数据链路层

控制网络层与物理层之间的通信,主要功能是保证物理线路上进行可靠的数据传递。为了保证传输,从网络层接收到的数据被分割成特定的可被物理层传输的帧。帧是用来移动数据结构的结构包,他不仅包含原始数据,还包含发送方和接收方的物理地址以及纠错和控制信息。其中的地址确定了帧将发送到何处,而纠错和控制信息则确保帧无差错到达。如果在传达数据时,接收点检测到所传数据中有差错,就要通知发送方重发这一帧。

Socket

网络协议(四):Socket 和 Websocket

WebService

WebService 使用的是 SOAP(Simple Object Access Protocol) 协议。

WebService 使用 SOAP 协议实现跨编程语言和跨操作系统平台。

WebService 采用 HTTP 协议传输数据,采用 XML 格式封装数据。

SOAP 协议= HTTP 协议 + XML 数据格式。

参考资料

TCP、UDP、Socket、HTTP网络编程面试题