「HTTP 使用指南|青训营笔记」

87 阅读7分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 6 天

今日内容:

  1. 初识HTTP
  2. HTTP协议分析
  3. 了解更多

初识HTTP

  • Hyper Text Transfer Protocol 超文本传输协议
  • 应用层协议,基于TCP协议
  • 请求响应
  • 简单可扩展
  • 无状态:没有记忆能力,每个请求都是独立的

HTTP协议分析

HTTP发展:

  • HTTP/0.9 单行协议

    • 请求GET/mypage.html
    • 响应只有HTML文档
  • HTTP/1.0 构建可扩展性

    • 增加了Header
    • 有了状态码
    • 支持多种文档类型
    • ....
  • HTTP/1.1 标准化协议(1997年)

    • 链接复用
    • 缓存
    • 内容协商
    • ...
  • HTTP/2 更优异的表现(2015年,在16年中68%的请求都是http/2)

    • 二进制协议
    • 压缩header
    • 服务器推送
    • ...
  • HTTP/3 草案

Method

GET请求一个指定资源的表示形式,使用GET的请求应该只被应用于获取数据
POST用于将实体提交到指定的资源,通常导致在服务器上的状态变化或副作用
PUT用请求有效载荷替换目标资源的所有当前表示
DELETE删除指定的资源
HEAD请求一个与GET请求的响应相同的响应,但没有响应体
CONNECT建立一个到由目标资源标识的服务器的隧道
OPTIONS用于描述目标资源的通信选项
TRACE沿着到目标资源的路径执行一个消息环回测试
PATCH用于对资源应用部分修改

safe(安全的):不会修改服务器的数据的方法

  • GET
  • HEAD
  • OPTIONS

idempotent(幂等):同样的请求被执行一次与连续执行多次的效果是一样的,服务器的状态也是一样的。所有safe方法都是idempotent的

  • GET
  • HEAD
  • OPTIONS
  • PUT
  • DELETE

状态码

  • 1XX -> 指示信息,表示请求已接受,继续处理

  • 2XX -> 成功,表示请求已被成功接收、理解、接受

    • 200 OK - 客户端请求成功
  • 3XX -> 重定向,要完成请求必须进行更进一步的操作

    • 301 - 资源(网页等)被永久转移到其它URL
    • 302 - 临时跳转
  • 4XX -> 客户端错误,请求由语法错误或请求无法实现

    • 401 Unauthorized - 请求未经授权
    • 404 - 请求资源不存在,可能是输入了错误的URL
  • 5XX -> 服务器端错误,服务器未能实现合法

    • 500 - 服务器内部发生了不可预期的错误
    • 504 Gateway Timeout - 网关或者代理的服务器无法在规定的时间内获得想要的响应。

RESTful API

RESTful API:一种API设计风格;REST - Representational State Transfer

  1. 每一个URI代表一种资源;
  2. 客户端和服务器之间,传递这种资源的某种表现层;
  3. 客户端通过HTTP method,对服务器端资源进行操作,实现“表现层状态转化”。
请求返回码含义
GET/zoos200 OK列出所有动物园,服务器成功返回了
POST/zoos201 CREATED新建一个动物园,服务器创建成功
PUT/zoos/ID400 INVAUD REQUEST更新某个指定动物园的信息(提供该动物园的全部信息) 用户发出的请求有错误,服务器没有进行新建或修改数据的操作
DELET/zoos/ID204 NO CONTENT删除某个动物园,删除数据成功

常用请求头

Accept接收类型,表示浏览器支持的MIME类型(对标服务端返回的Content-Type)
Content-Type客户端发送出去实体内容的类型
Cache-Control指定请求和响应遵循的缓存机制,如no-cache
if-Modified-since对应服务端的Lase-Modified,用来匹配看文件是否变动,只能精确到1s之内
Expires缓存控制,在这个事件内不会请求,直接使用缓存,服务端时间
Max-age代表资源在本地缓存多少秒。有效时间内不会请求,而是使用缓存
if-None-Match对应服务端的ETag,用来匹配文件内容是否改变(非常精确)
Cookie有cookie并且同域访问时会自动带上
Referer该页面的来源URL(适用于所有类型的请求,会精确到详细页面地址,csrf拦截常用到这个字段)
Origin最初的请求是从哪里发起的(只会精确到端口),Orgin比Referer更尊重隐私
User-Agent用户客户端的一些必要信息,如UA头部等

常用的响应头

Content-Type服务端返回的实体内容的类型
Cache-Control指定请求和响应遵循的缓存机制,如no-cache
Last-Modified请求资源的最后修改时间
Expires应该在什么时候认为文档已经过期,从而不再缓存它
Max-age客户端的本地资源应该缓存多少秒,开启Cache-Control后有效
ETag资源的特定版本的标识符,Etags类似于指纹
Set-Cookie设置和页面关联的cookie,服务器通过这个头部把cookie传给客户端
Server服务器的一些相关信息
Access-Control-Allow-Origin服务器端允许的请求Origin头部(譬如为*)

缓存

  • 强缓存

    • Expires,时间戳

    • Cache-Control

      • 可缓存性

        • no-cache:协商缓存验证
        • no-store:不使用任何缓存
      • 到期

        • max-age:单位是秒,存储的最大周期,相对于请求的时间
      • 重新验证*重新加载

        • must-revalidate:一旦资源过期,在成功向原始服务器验证之前,不能使用。配合max-age使用。一个场景时client和server disconnect后如果must - revalidate则不能用缓存
  • 协商缓存

    • Etag/If-None-Match:资源的特定版本的标识符,类似于指纹
    • Last-Modified/If-Modified-Since:最后修改时间

cookie

Set-Cookie-response

Name=value各种cookie的名称和值
Expires=DateCookie的有效期,缺省是Cookie仅在浏览器关闭之前有效
Path=Path限制指定Cookie的发送范围的文件目录,默认为当前
Domain=Domain限制cookie生效的域名,默认为创建cookie的服务域名
secure仅在HTTPS安全连接时,才可以发送Cookie
HttpOnlyJavaScript脚本无法获得Cookie
SameSite=[None/Strict/Lax]None同站、跨站请求都可以发送 Strict仅在同站发送 允许与顶级导航一起发送,并将与第三方网站发起的GET请求一起发送

HTTP/2概述:更快、更稳定、更简单

帧(frame):HTTP/2通信的最小单位,每个帧都包含帧头,至少也会表示出当前帧所属的数据流。

  • 二进制

消息:与逻辑请求过响应消息对应的完整的一系列帧。

数据流:已建立的连接内的双向字节流,可以承载一条或多条消息。

  • 交错发送,接收方重组织
  • HTTP/2连接都是永久的,而且仅需要每个来源一个连接
  • 流控制:阻止发送方向接收方发送大量数据的机制

HTTPS概述

  • HTTPS:Hyper Text Transfer Protocol Secure
  • 经过TSL/SSL加密
  • 对称加密:加密和解密都是使用同一个密钥
  • 非对称加密:加密和解密需要使用两个不同的密钥:公钥(public key)和私钥(private key)

了解更多

webSocket

  • 浏览器与服务器端进行全双工通讯的网络技术
  • 典型场景:实时性要求高,例如聊天室
  • URL使用 ws:// 或 wss:// 等开头

QUIC(Quick UDP Internet Connection)

  • 0 - RTT 建联(首次建联除外)。
  • 类似TCP的可靠传输。
  • 类似TLS的加密传输,支持完美前向安全。
  • 用户空间的拥塞控制,最新的BBR算法。
  • 支持h2的基于流的多路复用,但没有TCP的HOL问题。
  • 前向纠错FEC。
  • 类似MPTCP的Connection migration。