HTTP协议图文简述--HTTP/HTTPS/HTTP2

6,070 阅读14分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第30天,点击查看活动详情

01、准备

1.1、先了解下网络模型/TCP

HTTP 连接是建立在 TCP* 协议之上的,其数据传输功能是由TCP完成的,那TCP又是什么呢?

image

TCP 是一个单纯用来建立通信连接,并传输数据的基础协议,属于网络模型中的的传输层。

OSI 模型(Open System Interconnection Model)是一个由国际标准化组织(ISO)提出的概念模型,目的是为计算机网络提供一个标准框架。它将计算机网络体系结构划分为七层,每层都提供抽象良好的接口,负责不同的职责。了解 OSI 模型有助于理解实际上互联网络的工业标准——TCP/IP 协议,以及前端开发常用的HTTP协议。

image.png image

OSI七层模型TCP/IP概念层模型功能TCP/IP协议族
应用层应用层文件传输,电子邮件,文件服务,虚拟终端TFTP, HTTP,SNMP,FTP,SMTP,DNS,Telnet
表示层数据格式化,代码转换,数据加密没有协议
会话层解除或建立与别的连接点的联系没有协议
传输层传输层提供端对端的接口TCP,UDP
网络层网络层为数据包选择路由IP,ICMP, RIP,OSPF,BGP,IGMP
数据链路层链路层传输有地址的帧以及错误检测功能SLIP,CSLIP,PPP,ARP,RARP,MTU
物理层以二进制数据形式在物理媒体上传输数据IS02110,IEEE802,IEEE802.2

要建立TCP连接需要:①请求 --> ②确认 --> ③建立连接,就是著名的三次握手 🤝🏻。TCP的三次握手建立连接后,就可以开始进行通信(数据传输)了。所以要正式通信一次,前期要传输交换多次信息(多次握手),这么做的目的是为了确保双方的状态正确,保障数据的传输是完整、有序、可靠无差错的。

image.png

  • 第一次握手:客户端发送syn包到服务器,并进入SYN_SENT状态,等待服务器确认。
  • 第二次握手:服务器收到syn包,必须确认客户的SYN,同时自己也发送一个SYN包(syn=y),即SYN+ACK包,此时服务器进入SYN_RECV状态。
  • 第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK,此包发送完毕,客户端和服务器进入连接成功状态,完成三次握手。夫妻对拜,礼成,进入洞房!

02、认识HTTP协议

2.1、HTTP 是什么?

HTTP —— HyperText Transfer Protocol,超文本传输协议。是当今互联网上应用最为广泛的一种网络协议,所有的 WWW(万维网) 文件都必须遵守这个标准。包括三个部分:超文本、传输、协议。

image

  • 🔸协议:协议就是一种事先的约定规范,HTTP协议是面向计算机,用于计算机之间通信的规范,规范了内容的结构、行为、错误处理机制等。就像我们以前用的“邮编+地址”也是一种通信协议。
  • 🔸传输:从一端(A)传输内容导另一端(B)的过程,就是传输,传输过程A、B是双向的。客户端(浏览器)向服务端请求网页数据,服务端收到请求后返回对应的数据,客户端(浏览器)收到数据后渲染出网页展示给用户。

image

  • 🔸超文本:HTTP 传输的内容是「超文本」,字面意思就是超越了基本文字内容各种互联网内容,包括图片、音频、视频、压缩包、文件等,都是HTTP的「超文本」,这些内容通过浏览器渲染展现出来,创造了丰富多彩的网络生活。

image

🔵 HTTP 就是用来在计算机/网络里传输超文本数据的一种协议规范,主要特点是:

  • 简单,基本报文结构就是header+bodyheader中信息都是key:vlaue结构的。
  • 灵活:结构中的各种数据字段并没有严格的限制,可以灵活的自定义扩展。如可以添加新的状态码,可以在header中扩展任意字段。
  • 跨平台:HTTP的应用非常广泛,几乎所有平台都支持。

🟠缺点

  • 无状态:客户端与服务端通信都是无状态的,没有前后文的概念。好处是不用管理状态,只单纯的处理好每一次请求即可。但当遇到一些场景,如登录、选购商品、下单支付,是一连串的操作,有前后关联的,就得自己实现上下文管理了。常用cookiesessionsessionStorage来解决。
  • 明文传输不安全:明文传输,在传输过程中很容易被截获、篡改,解决办法就是启用HTTPS。

2.2、HTTP协议结构

HTTP协议的报文结构:start-lineheaderbody

image

Header中的字段为 key: value结构,按行分割。

常用Header字段描述
🪧请求头 request-line第一行为 请求行请求方法 URL HTTP协议版本,空格分割。请求方法有GET、POST等
Host发送的目标,服务器的域名、端口号
Connection网络连接方式,默认值keep-alive表示使用 TCP 持久连接,以便其他请求复用
Accept告诉服务端可以接受的资源的(MME)类型
Accept-Encoding告诉服务端可以支持哪些压缩方式,常用压缩方式:gzip主流、deflatebrHTTP专用压缩算法
CookieCookie数据
User-Agent浏览器表明自己的身份
Referer表示请求引用自哪个地址
🪧响应头 status-line第一行为 状态行HTTP协议版本 状态码 状态码描述,空格分割
Content-Length服务器返回数据的长度
Content-Type资源的(MME)类型,告诉客户端是什么类型的资源
Content-Encoding发送的实体数据采用的编码类型(压缩方式),和Accept-Encoding对应
Transfer-Encodingchunked表示分块传输数据
Server表示服务器名称
Set-Cookie后端设置的 Cookie 信息
Expires缓存过期时长

🪧请求HTTP报文

GET / HTTP/1.1    //* 请求行,URL中的域名部分再Host字段, *//
Host: www.baidu.com    //* 请求的地址 *//
Accept: text/html,image/avif,image/webp,*/*;    //* 告诉服务端可以接受的资源的(MME)类型 *//
Accept-Encoding: gzip, deflate, br  //* 告诉服务端可以支持哪些压缩方式 *//
Connection: keep-alive

image.png

🪧响应HTTP报文

HTTP/1.1 200 OK    //* 响应状态行 *//
Connection: keep-alive    //* 保持长连接 *//
Content-Encoding: gzip    //* 数据采用了gzip压缩,客户端对应采用gzip进行解压 *//
Content-Type: text/html; charset=utf-8    //* 返回数据的类型为文本/网页html,编码格式为utf-8 *//
content-length: 4560    //* 返回实体数据的长度 *//

2.3、HTTP状态码

状态码描述常用状态码
1xx🪧提示信息,处理的中间状态,很少用
2xx✅处理成功的状态- 200: OK 成功,一切正常,最常用。
- 204: No Content 成功但没有body数据
- 206: Partial Content 成功但仍需继续,常用于分块下载、断点续传
3xx⚠️重定向,客户端请求的资源发送了变动,需要重新发起请求继续处理- 301: Moved Permanently 永久重定向,请求的资源转移到了新URL
- 302: Found 请求的页面临时移动到新URL,后续请求继续用原URL
- 304: Not Modified 资源未修改,客户端缓存了资源,重定向到本地
4xx🚫客户端发生错误:语法、请求错误等,服务端无法处理- 400: Bad Request 请求的报文有错误,具体不明
- 403: Forbidden 请求了服务端禁止访问的资源( /fərˈbɪdn/ 禁止的)
- 404: Not Found 请求的资源不存在、未找到
5xx⛔服务端发生错误:不能满足客户端请求- 500: Internal Server Error 服务端错误,具体不明
- 501: Not Implemented 还没实现,暂不支持
- 502: Bad Gateway 网关、代理错误
- 503: Service Unavailable 服务端很忙,请稍后再试

打开百度首页资源列表-状态:

image.png

2.4、请求方式GET/POST/...

请求方式描述
GET请求指定的页面数据,请求的参数放在URL地址中
POST向指定资源提交数据,请求服务器处理,数据在请求体body中。数据可以是ASCII字符也可以是字节型数据
HEAD类似GET请求,用于获取响应的头部信息,不返回内容。
PUT即向指定资源位置上传其最新内容,可用于上传、更新资源。
DELETE请求服务器删除所标识的资源
TRACE回显服务器收到的请求,主要用于测试或诊断。
OPTIONS允许客户端访问服务器的性能
CONNECTHTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接(经由非加密的HTTP代理服务器)。

✔️最常用的是GET、POST两种方式。RESful API 接口规范的一般会用到 POSTDELETEGETPUT(分别对应增删查改)。

❓GET、POST区别:

GETPOST
提交方式数据在url的问号?后:url?key=value&key=...数据在请求体body中
编码enctype只有appliacation-x-www-form-urlencoded支持多种
书签/历史可以加入收藏,历史记录、日志会保留数据不可收藏、不会保留数据
缓存/效率可以被浏览器缓存,效率(速度)更高不可缓存
数据类型/长度只允许 ASCII 字符,URL长度有限制(2048),不同浏览器不同。类型没有限制,支持二进制数据。长度(几乎)无限制
安全性安全性更低,数据在URL中容易暴露安全性稍高,不过传输过程也是明文的,不会在浏览记录、日志中存储
回退/刷新?无副作用(幂等),可重复访问,因为只是 读取 信息有副作用,数据会被重新提交(不幂等),浏览器一般会提示用户数据会被重新提交
使用场景获取数据提交数据:添加、修改、删除

📢幂等」,意思是多次执行相同的操作,结果都是「相同」。

  • 在 HTTP 协议里,所谓的「安全」是指请求方法不会「破坏」服务器上的资源。

03、HTTPS有什么用?

3.1、什么是HTTPS?

HTTPS:超文本传输安全协议(Hyper Text Transfer Protocol over Secure Socket Layer)。可以理解为多了个一个S(Secure)的HTTP,主要是解决HTTP不安全的问题。

image.png

HTTP 是明文传输,存在安全风险的问题。HTTPS 则解决了 HTTP 不安全的缺陷,在 TCP 和 HTTP 网络层之间加入了 SSL/TLS 安全协议,使得报文能够加密传输,解决了HTTP存在的安全问题。SSL / TLS 全称安全传输层协议 Transport Layer Security,是介于 TCP 和 HTTP 之间的一层安全协议,不影响原有 TCP、HTTP 协议,所以使用 HTTPS 基本上不需要对 HTTP 页面进行改造。

  • ✅ 加密防窃听:采用对称加密+非对称加密的混合加密的方式,对传输的数据加密,实现信息的机密性,解决了窃听的风险。
  • ✅ 摘要防篡改:用摘要算法为数据生成独一无二的「指纹」校验码,指纹用来校验数据的完整性,解决了被篡改的风险。
  • ✅ CA证书防假冒:将服务端的公钥放入到CA数字证书中,解决了服务端被冒充的风险。特别是一些假冒的淘宝、银行网站就无处遁形了。

➤ HTTP、HTTPS的主要区别:

HTTPHTTPS
加密传输?明文传输混合加密传输,比较安全
建立连接TCP三次握手TCP三次握手 + SSL/TLS握手
默认端口号80443
证书没有服务端需要CA数字证书,保障服务端身份是可信的

📢总结:HTTPS相比HTTP,在建立连接时多了一次握手(SSL/TLS握手),传输数据时,多了数据加密

HTTPS 在 TCP 三次握手之后,还需进行 SSL/TLS 的握手过程🤝🏻,才可开始加密通信。SSL/TLS 协议基本流程:

  • 客户端向服务器索要并验证服务器的公钥。客户端收到服务端的数字证书后,会基于浏览器、操作系统中的CA公钥进行验证,确保服务端是可信的,这里的CA数字证书是由专门的权威的机构来签发、认证和管理的。
  • 双方协商产生「会话秘钥」。基于数字证书,及多次握手中产生的数据,成本次通信的「会话秘钥」。
  • 双方采用「会话秘钥」进行加密通信。后面就和普通的HTTP通信类似,多了数据加密、数据摘要。

image

  • 🔐对称加密:使用相同密钥加密/解密,密钥容易泄漏。
  • 🔐非对称加密:公钥加密数据,私钥解密数据,但是加密/解密耗时多。
  • 🔐混合加密:二者结合,公钥加密密钥,密钥加密数据,私钥解密密钥,密钥解密数据(非对称传送密钥,对称密钥传送数据,完美!)。

3.2、SSL/TLS是什么?和HTTPS的关系?

SSL/TLS可以理解为HTTPS的一部分,是HTTPS的安全协议,实现了HTTP安全的数据传输(加密+校验)。SSL、TLS两者算是同伴关系,作用一样,TLS是SSL的升级版,两者都在使用,浏览器都支持。

  • SSL(Secure Sockets Layer ,安全套接层): 是由公司设计的用于Web的安全传输协议,使用广泛。
  • TLS(Transport Layer Security,传输层安全):1999年,互联网标准化组织ISOC接替网景(NetScape)公司,发布了SSL的升级版 TLS

image


04、HTTP协议版本1.0/1.1/2

1997年发布的HTTP/1.1版本使用至今,是目前主流的HTTP协议版本。2015年HTTP/2 发布,是基于谷歌的SPDY 协议,在Chrome浏览器中率先支持,可能有不到一般的网站支持。

image.png image

HTTP版本特点/描述
HTTP/1.0🔵主要特点(不足):
- 短连接:每次通信都需建立新的TCP连接,请求、响应完成后结束连接。通信效率低,需要频繁的建立连接。
- 串行:一次通信(请求、响应)结束后才能继续下一次。
HTTP/1.1🔵主要特点
- 长链接:也叫持久连接,建立一次TCP连接后可重复使用,一直保持TCP连接,任意一方主动断开才会结束连接。
- 管道传输:不必串行排队等候了,可以并行连续发送多次请求,但服务端会顺序处理。
🟠缺点
- Header: 不支持压缩(只有Body支持压缩),每次相同的header浪费,特别是CookieUser Agent
- 队头阻塞,在服务端,如果前面的请求服务端还没处理完,后面的请求就会排队等候,顺序执行没有优先级控制。
- 单向请求:客户端请求,服务端被动响应,服务端无法主动联系客户端。
HTTP/2🟢基于HTTPS,所以是有安全保障的:
- Header:支持头部header压缩,以及重复header的优化。
- 帧数据header/body都是二进制格式,统称为帧(frame)。HTTP/1.1的header为文本(ASCII编码),body支持文本/二进制。
- 多路复用:支持并行请求、响应,客户端、服务端都不用排队等待了。
- 服务器推送,服务器可以主动推送数据到客户端。
HTTP/3主要改进在传输层上,基于UDP协议,主要特点是⚡。HTTP 3.0 于 2022 年 6 月正式发布,依然是谷歌发起的。

HTTP连接是建立在TCP协议之上的,属于应用层协议,所以HTTP通信需要先建立TCP连接。

image


参考资料


©️版权申明:版权所有@安木夕,本文内容仅供学习,欢迎指正、交流,转载请注明出处!原文编辑地址-语雀