HTTP协议入门详解

193 阅读9分钟

简介

HTTP协议(超文本传输协议HyperText Transfer Protocol),它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。

注:客户端与服务器的角色不是固定的,一端充当客户端,也可能在某次请求中充当服务器。这取决与请求的发起端。HTTP协议属于应用层,建立在传输层协议TCP之上。客户端通过与服务器建立TCP连接,之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。

HTTP 是一种无状态 (stateless) 协议, HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务, 提高效率。客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。

HTTP URL

HTTP协议是一个基于请求和应答模式的,存在于传输层之上的应用层协议,是一个无状态的协议,通常是基于TCP的连接方式.HTTP的URL是一种特殊类型的URI,包含了用于定位查找某个网络资源的路径,格式如下:

http://host[':'port][abs_path]

http表示通过http协议来定位网络资源; host表示合法的Internet主机域名或者IP地址; port指定一个端口,如果缺省,默认是80端口;abs_path表示的是请求的资源的URL,如果什么都没写,则浏览器会帮我们加上‘/’,作为初始的路径地址。

HTTP请求(Request)

如下图,HTTP请求由三部分组成:请求行,请求头,请求正文(数据)。

image.png

下图为一个请求的报文:

image.png

①是请求方法,HTTP协议的请求方法有:GET: 请求获取Request-URI所标识的资源; POST: 在Request-URI所标识的资源后增加新的数据; HEAD: 请求获取由Request-URI所标识的资源的响应消息报头; PUT: 请求服务器存储或修改一个资源,并用Request-URI作为其标识; DELETE: 请求服务器删除Request-URI所标识的资源; TRACE: 请求服务器回送收到的请求信息,主要用于测试或诊断; CONNECT: 保留将来使用; OPTIONS: 请求查询服务器的性能,或者查询与资源相关的选项和需求; 其中GET和POST是最常见的HTTP方法,当前的大多数浏览器只支持GET和POST。

②为请求对应的URL地址,它和报文头的Host属性组成完整的请求URL,③是协议名称及版本号。①、②和③构成HTTP的请求状态行,请求行由请求Method,URL字段和HTTP Version三部分组成,总的来说请求行就是定义了本次请求的请求方式和,请求的地址,以及所遵循的HTTP协议版本,例如:

GET /example.html HTTP/1.1 (CRLF)

④是HTTP的报文头,报文头包含若干个属性,格式为“属性名:属性值”,服务端据此获取客户端的信息,其中一些常见的请求头属性为:

image.png

⑤是报文体,它将一个页面表单中的组件值通过param1=value1&param2=value2的键值对形式编码成一个格式化串,它承载多个请求参数的数据。不但报文体可以传递请求参数,请求URL也可以通过类似于“/chapter15/user.html? param1=value1&param2=value2”的方式传递请求参数。

HTTP响应(Response)

如下图:HTTP响应也由三部分组成,包括状态行、消息报头和响应报文。

image.png 第一部分:状态行,由HTTP/1.1(协议版本)200(状态码)OK(状态码的描述)构成
第二部分:响应头,由一些键值对购车航,用来说明客户端要使用的一些附加信息
第三部分:响应正文,服务器返回给你客户端的文本信息

HTTP响应状态码

状态码有三位数字组成,第一个数字定义了响应的类别,且有五种可能取值:

  • 1××:指示信息—表示请求已接受哦,继续处理
  • 2××:成功—表示请求已被成功接受、理解、接受
  • 3××:重定向—要完车请求必须进行更进一步的操作
  • 4××:客户端错误—请求有语法错误或者请求无法实现
  • 5××:服务器端错误—服务器未能实现合法的请求 以下是常见的一些状态码、状态描述、说明:
  • 200:OK-客户端请求成功
  • 400:Bad Request-客户端请求有语法错误,不能被服务器所理解
  • 401:Unauthorized-请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
  • 403:Forbidden - 服务器收到请求,但是拒绝提供服务
  • 404:Not Found - 请求资源不存在,eg:输入了错误的URL
  • 500:Internal Server Error - 服务器发生不可预期的错误
  • 503:Server Unavailable - 服务器当前不能处理客户端的请求,一段时间后,可能恢复正常

HTTP的工作原理、特点与请求/响应步骤

原理

HTTP协议定义了web客户端如何从web服务器请求Web页面,以及服务器如何把Web页面传送给客户端.HTTP协议采用了请求/响应模型.客户端向服务器发送一个请求报文,请求报文包括请求的方法,url,协议版本,请求头部和请求数据.服务器以一个状态行作为响应,响应的内容包括协议的版本,成功或者错误代码,服务器信息,响应头部和响应数据。

特点
  1. 支持客户/服务器模式。
  2. 简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
  3. 灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
  4. 无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。早期这么做的原因是请求资源少,追求快。后来通过Connection: Keep-Alive实现长连接(持久连接与非持久连接:在实际的应用中,客户端往往会发出一系列请求,接着服务器端对每个请求进行响应。对于这些请求|响应,如果每次都经过一个单独的TCP连接发送,称为非持久连接。反之,如果每次都经过相同的TCP连接进行发送,称为持久连接。)
  5. 无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快
请求/响应步骤
  1. 客户端连接到服务器
  2. 发送HTTP请求
  3. 服务器接受请求分析后返回HTTP响应
  4. 释放TCP连接
  5. 客户端浏览器解析HTML内容

HTTP与HTTPS

HTTPS(Hypertext Transfer Protocol Secure:超文本传输安全协议)是一种透过计算机网络进行安全通信的传输协议。HTTPS 经由 HTTP 进行通信,但利用 SSL(Secure Socket Layer, 安全套接层)/TLS(Transport Layer Security, 安全层传输协议) 来加密数据包。HTTPS 开发的主要目的,是提供对网站服务器的身份认证,保护交换数据的隐私与完整性。

HTTPS 默认工作在 TCP 协议443端口,它的工作流程一般如以下方式:

  1. TCP 三次同步握手
  2. 客户端验证服务器数字证书
  3. DH 算法协商对称加密算法的密钥、hash 算法的密钥
  4. SSL 安全加密隧道协商完成
  5. 网页以加密的方式传输,用协商的对称加密算法和密钥加密,保证数据机密性;用协商的hash算法进行数据完整性保护,保证数据不被篡改。
区别
  • HTTP 明文传输,数据都是未加密的,安全性较差,HTTPS(SSL+HTTP) 数据传输过程是加密的,安全性较好。
  • 使用 HTTPS 协议需要到 CA(Certificate Authority,数字证书认证机构) 申请证书,一般免费证书较少,因而需要一定费用。证书颁发机构如:Symantec、Comodo、GoDaddy 和 GlobalSign 等。
  • HTTP 页面响应速度比 HTTPS 快,主要是因为 HTTP 使用 TCP 三次握手建立连接,客户端和服务器需要交换 3 个包,而 HTTPS除了 TCP 的三个包,还要加上 ssl 握手需要的 9 个包,所以一共是 12 个包。
  • http 和 https 使用的是完全不同的连接方式,用的端口也不一样,前者是 80,后者是 443。
  • HTTPS 其实就是建构在 SSL/TLS 之上的 HTTP 协议,所以,要比较 HTTPS 比 HTTP 要更耗费服务器资源。
工作原理与步骤
  1. 客户端发起HTTPS请求
  2. 服务端配置
  3. 传送证书
  4. 客户端解析证书
  5. 传送加密信息
  6. 服务端解密信息
  7. 传输加密后的信息
  8. 客户端解密信息

结语

以上就是关于HTTP的一些知识详解,希望能给在学习HTTP相关知识的你解答一点疑惑。