HTTP协议 | 青训营笔记

109 阅读6分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第7天,学习的是关于HTTP协议的相关知识。

一、 HTTP协议基本知识

(一)基本定义

  • Hyer Text Transfer Protocol
  • 超文本传输协
  • 应用层协议,基于TCP协议
  • 请求 响应
  • 简单可扩展
  • 无状态:每一个请求之间是孤立的

image.png

(二)发展历程

image.png

1. HTTP/0.9:

  • 请求GET/mypage.html
  • 响应只有HTML文档

2. HTTP/1.0——也是标准化协议版本

  • 增加了Hoadar
  • 有了状态码
  • 支持多种文档类型

3. HTTP/1.1

  • 链接复用
  • 缓存
  • 内容协商

4. HTTP/2

  • 二进制协议
  • 压缩 header
  • 服务器推送

(三)协议分析

1. 协议分析——报文结构

以HTTP/1.1为例

1.jpg

(1)各字段含义

a. Method 2.jpg

特点:

  • safe:不会修改服务器数据的方法
  • idempotent(幂等):同样的请求执行一次与执行多次效果一样,服务器状态也一样;所有的safe方法都是idempotent的

b. 状态码

3.jpg 例如:

  • 200 OK:客户端请求成功
  • 301-资源(网页等)被永久移到其它URL
  • 302-临时跳转
  • 401 Unauthorized-请求未经授权
  • 404-请求资源不存在,可能是输入了错误的URL
  • 500-服务器内部发生了不可预期的错误
  • 504 Gateway Timeout-网关或者代理的服务器无法在规定的时间内获得想要的响应

c. RESTful API

一种API设计风格;rest- Represe State Transfer

  • 每一个URI代表一种资源;
  • 客户端和服务器之间,传递这种资源的某种表现层;
  • 客户端通过HTTP method,对服务器端资源进行操作,实现“表现层状态转化”。

(2)常用请求头

  • Accept:告诉服务端,该请求所支持的相应数据类型
  • Cookie:将客户端的cookie放在请求头里一并发送给服务器端;
  • Referer:表示从哪个URL跳转的;
  • Cache-control:对服务端返回内容进行缓存控制,即是否需要在客户端保存下来;
  • User-Agent:表示客户端使用的操作系统及版本,CPU类型,浏览器版本;
  • Host:头域指定请求资源的Intenet主机和端口号;
  • Connection:表示客户端与服务器连类型,是否是Keep-Alive

(3) 常用响应头

  • Content--type:服务端返回的实体内容的类型
  • Cache-Control:指定请求和响应遵循的缓存机制,如no-cache
  • Last -Modified:请求资源的最后修改时间
  • Expires:应该在什么时候认为文档已经过期从而不再缓存它
  • Max-ape:客户端的本地资源应该缓存多少秒,开启了 Cache-Control后有效
  • ETap:资源的特定版本的标识符, Etags类似于指纹
  • Set-Cookie:设置和页面关联的 cookie,服务器通过这个头部把 cookie传给客户端
  • Server:服务器的一些相关信息
  • Access-Control-Origin-- Allow-Origin:服务器端允许的请求头部(譬如为*)

以缓存为例

  1. 强缓存

Expires(到期时间),时间戳

Cahce-Control

  • 可缓存性:    
       no-cache:协商缓存验证
       no-store:不使用任何缓存
       publicprivate
  •  到期:
       max-age:单位是秒,存储的最大生存周期,相对于请求的时间
    
  •  重新验证*重新加载:
      must-revalidate:一旦资源过期,在成功向原始服务器验证之前,不能使用
    
  1. 协商缓存

Etag/If-None-Match:

  • 资源的特定版本的标识符,类似于指纹
    

Last-Modified/If-Modified-Since:

  • 最后的修改时间
    

4.jpg

2. 协议分析——版本发展

HTTP/2:更快、更稳定、更简单

相关概念:

  • 帧(fram):HTTP/2通信的最小单位,每个帧都包含帧头,至少也会标识出当前帧所属的数据流。
  • 消息:与逻辑请求或响应消息对应的完整的一系列帧。
  • 数据流:已建立的连接内的双向字节流,可以承载一条或多条消息:交错发送,接受方重组织。
  • 复用性:HTTP/2连接都是永久的,而且仅需要每个来源一个连接。
  • 流控制:阻止发送方向接收方发送大量数据的机制
  • 服务器推送

5.jpg

二、HTTP 协议的应用场景分析

(一)场景分析——静态分析

以新浪微博为例:

  1. 打开chrome
  2. 输入:www.sina.com
  3. 打开控制台

6.jpg

  1. 切换到network

7.jpg

可以已经看出:

  • 返回状态码是200;
  • (from memory cache):从本地缓存拿的响应

8.jpg

由上图响应头,可以看出:

  • 强缓存(max-age=xxxxx)
  • Cache-control:以秒为单位,换算一下,4h
  • 资源类型:css(content-type) 静态资源方案:缓存 + CDN + 文件名hash

(二)场景分析——登录

  1. 账号密码登录:

  2. 打开控制台——network——勾选preserve log——过滤quick_login

  3. 观察请求

  • 跨域问题,导致了请求方法为option 11.jpg

  • 协议、主机名、端口任意一者不同都会出现跨域问题

  • HTTP的默认端口号443
    13.jpg

  • 解决跨域问题

(1)CORS( Cross-Origin Resource Sharing ): 跨源资源共享;

(2)代理服务器:同源策略是浏览器的安全策略,不是HTTP的;

(3)Iframe:诸多不便。

  • 下一次进入页面的时候,网站为什么能够记住登陆状态呢——鉴权

(1)Session + cookie (大部分这种门户网站)

  • 用户发起提交请求给服务器,包括用户名密码等等
  • 服务器处理,鉴别其正确性,若正确则返回Session将其种到cookie(Set-Cookie:session = …)
  • 用户再发送时:GET Cookie:session=…
  • 服务器处理鉴别后返回一些登陆信息的

14.jpg

(2)JWT(JSON web token) 服务器本地不会存储 返回的token唯一性,登陆时间短等

15.jpg

(3)SSO:单点登录(Single Sign On)

16.jpg

三、HTTP 协议实战分析

(一)实战分析——浏览器

1. AJAX之XHR

  • XHR: XMLHttpRequest
  • readyState

17.jpg

2. AJAX之Fetch

  • XMLHttpRequet的升级版
  • 使用Promise
  • 模块化设计,Response,Request,Header对象
  • 通过数据流处理对象,支持分块读取

(二)实战分析——Node篇

1.标准库: HTTP/HTTPS

  • 默认模块,无需安装其他依赖
  • 功能有限/不是十分友好

2.常用的请求库: axios

  • 支持浏览器、nodejs环境
  • 丰富的拦截器
//全局配置
axios.defaults.baseURL = "https://api.example.com";
//添加请求拦截器
axios.interceptors.request.use(function (config) {
	//在发送请求之前做些什么
	return config;
},function (error) {
	//对请求错误做些什么
	return Promise.reject(error );
});
//发送请求
axios( { 
    method: 'get',
    url: 'http://test.com',
    responseType: 'stream
    }).then( function(response) {
    response.data.pipe( fs.createWriteStream('ada_lovelace.jpg'))
});

(三)实战分析——用户体验

1.网络优化

18.jpg

2.稳定性

19.jpg

  • 重试是保证稳定的有效手段,但要防止其加剧恶劣情况:比如网络连接就是断开了
  • 缓存合理使用,作为最后一道防线。

四、扩展——通信方式

(一)WebSocket

  • 浏览器与服务器进行全双工通讯的网络技术
  • 典型场景:实时性要求高,例如聊天室
  • URL使用ws://或wss://等开头

(二)QUIC:Quick UDP Internet Connection 基于UDP

  • 0-RTT建联(首次建联除外)。
  • 类似TCP的可靠传输。
  • 类似TLS的加密传输,支持完美前向安全。
  • 用户空间的拥塞控制,最新的BBR算法。
  • 支持h2的基于流的多路复用,但没有 TCP的HOL问题。
  • 前向纠错FEC。
  • 类似MPTCP的Connection migration。
  • 应用暂不多。