《图解HTTP》——简单的HTTP协议

581 阅读5分钟

前言

目前,前端必须要了解的知识中HTTP必不可少,而自己也在学习当中,我主要是通过阅读《图解HTTP》进行学习,下面是自己的一些读书笔记

HTTP是一种不保存状态的协议

HTTP是一种不保存状态的协议

HTTP是一种无状态的协议。HTTP协议自身不对请求和响应之间的通信状态进行保存。也就是说HTTP这个级别,协议对于发送过的请求和响应都不做持久化的处理。

为什么要这么做?

这是为了更快的处理大量的事务,确保协议的可伸缩性。而特意把HTTP设计得这么简单的。

那么我要保存状态的话要怎么做?

HTTP/1.1提出了相应的解决方法,虽然HTTP1.1也是无状态的协议,但是引入了Cookie技术。有了Cookie再使用HTTP通信,就可以管理状态了。后面我会总结到Cookie。

HTTP方法

HTTP方法有哪些?它们又有哪些用途

  • GET方法。获取资源。用来请求访问一杯URI识别的资源。指定的资源经过服务器解析后返回的响应内容。
  • POST方法。传输内容实体。虽然GET方法也可以用来传输内容实体,但是我们一般都不怎么做。POST的主要目的并不是获取响应的主体内容。
  • PUT方法。传输文件。就想FTP协议中的请求文件上传一样,要求在请求报文的实体中包含文件内容,然后保存到请求的URI指定的位置。但是鉴于HTTP1.1的PUT方法自身不带有验证机制,任何人都可以上传文件,存在安全问题,因此一般的网站不选用这种方式。如果配合Web应用程序的验证机制,或架构设计采用REST标准的同类Web网站,就可能会开放使用PUT方法。
  • HEAD方法。获取报文首部 。HEAD方法和GET方法一样,只是不返回报文的主体部分。用于确认URI的有效性以及资源更新的日期时间等。
  • DELETE方法。删除文件。与PUT方法相反,按照请求的URI删除指定的资源。
  • OPTIONS方法用来查询针对请求的URI指定的资源支持的方法。

  • TRACE。追踪路径。让web服务器将之前的请求通信环回给客户端的方法。发送请求的时候,在Max-Forwards首部字段中加入数值,每经过一个服务器端该数字就减一,当数值刚好减到0的时候,就停止传输,最后收到请求的服务器返回的200OK的响应。

但是TRACE方法本来就不怎么常用,而且它容易引发XST(跨站追踪),通常就更加不会用到了。

CONNECT方法。要求隧道协议连接代理 CONNECT方法要求在与代理服务器通信的时候建立隧道,实现用隧道协议进行TCP通信。主要使用SSL(secure sockets layer,安全套接层)和TLS(Transport Layer Security,传输层安全)协议把通信内容加密后经过网络隧道传输。 CONNECT方法的格式如下: CONNECT代理服务器名:端口号 HTTP版本

最后,我们要知道,方法的作用在于,可以指定请求的资源按照期望产生某种行为。而且方法的名称分大小写之分,记得使用大写。

方法一览图

持久连接节省流量

在一开始的HTTP协议中,每进行一次HTTP 通信就断开一次TCP连接。

在请求一个很多资源的HTML页面的时候,每次连接都会造成无所谓的TCP连接的建立和断开,增加了通信量的开销。

什么是持久连接

持久连接也被称为HTTP keep alive或者HTTP connection reuse。它的特点是,只要任意一端没有明确提出断开连接,则保持TCP连接状态。

这样做的好处:

  • 减少了TCP连接重复建立和断开的时间开销
  • 减轻了服务端的负载

在HTTP/1.1中,所有的连接默认都是持久连接,但是HTTP/1.0内比没有标准化。虽然有一部分服务端通过一些非标准的手段实现了持久连接,但服务端不一定能够支持持久连接。

什么是管线化

之前需要发送请求之后必须等待并且接收到回应之后,才能发送下一个请求。管线化技术出现之后,就不用等待就可以发送下一个请求了。

管线化的好处

  • 能够做到同时并行发送多个请求,而不需要一个接着一个地等待响应。

Cookie技术

Cookie的工作原理:Cookie会根据从服务端发送的响应报文中的一个称set-Cookie的首部字段中,通知客户端保存Cookie。当客户端下次再往服务端发送请求的时候,客户端会自动在请求报文中加入Cookie值发送出去。

服务端接收到Cookie后,会去检查究竟是从哪一个客户端发送过来的(主要是通过对比服务端的记录),最后得到之前的状态信息。

  • 第一次请求的时候(也就是还没有Cookie)

  • 第二次请求的时候

上面两次请求的请求和响应报文如下所示:

具体的还可以看session和session_id的理解