【计算机网络】HTTP

104 阅读5分钟

HTTP

HTTP 基本概念

HTTP 是超文本传输协议,也就是HyperText Transfer Protocol

  • 超文本:超越了普通文本的文本,它是文字、图片、视频等的混合体
  • 传输:两点之间双向传输数据
  • 协议:两个以上的参与者(计算机)的行为约定和规范

HTTP 是一个在计算机世界里专门在「两点」之间「传输」文字、图片、音频、视频等「超文本」数据的「约定和规范」。

HTTP状态码

  • 1xx :提示信息,是协议处理中的一种中间状态,实际用到的比较少。

    • 「101 Switching Protocols」协议切换
  • 2xx :服务器成功处理了客户端的请求。

    • 「200 OK」一切正常。如果是非 HEAD 请求,服务器返回的响应头都会有 body 数据。
    • 「204 No Content」与 200 OK 基本相同,但响应头没有 body 数据。
    • 「206 Partial Content」是应用于 HTTP 分块下载或断点续传,表示响应返回的 body 数据并不是资源的全部,而是其中的一部分,也是服务器处理成功的状态。
  • 3xx:重定向,客户端请求的资源发生了变动,需要客户端用新的 URL 重新发送请求获取资源。

    • 「301 Moved Permanently」永久重定向,说明请求的资源已经不存在了,需改用新的 URL 再次访问。
    • 「302 Found」临时重定向,说明请求的资源还在,但暂时需要用另一个 URL 来访问。
    • 「 303 See Other」重定向到其他资源,常用于POST/PUT方法的响应中
    • 301 和 302 在响应头里使用字段 Location,指明后续要跳转的 URL,浏览器会自动重定向新的 URL。
    • 「304 Not Modified」缓存重定向,资源未修改,重定向已存在的缓冲文件。
    • 「 307 Temporary Redirect 」类似302的临时重定向,但请求方法不得改变
    • 「 308 Permanent Redirect」类似301的永久重定向,但请求方法不得改变
  • 4xx :客户端发送的报文有误,服务器无法处理。

    • 「400 Bad Request」客户端请求的报文有错误,但只是个笼统的错误。
    • 「403 Forbidden」服务器禁止访问资源,并不是客户端的请求出错。
    • 「404 Not Found」请求的资源在服务器上不存在或未找到,所以无法提供给客户端。
  • 5xx :客户端请求报文正确,但是服务器处理时内部发生了错误,属于服务器端的错误码。

    • 「500 Internal Server Error」笼统通用的错误码,服务器发生了什么错误并不知道。

    • 「501 Not Implemented」客户端请求的功能还不支持。

    • 「502 Bad Gateway」服务器作为网关或代理时返回的错误码,表示服务器自身工作正常,访问后端服务器发生了错误。

    • 「503 Service Unavailable」服务器当前很忙,暂时无法响应客户端。

HTTP常见字段

  • 通用字段:

    • Connection :使用「HTTP 长连接」机制,以便其他请求复用。HTTP/1.1 版本的默认。
    • Cache-Control:用于通知位于客户端和服务器端之间的理服务器如何使用已缓存的页面。
    • Date:表示消息产生的日期和时间。
    • Warning:包含与此响应相关的警告信息。
  • 请求头字段:

    • Host:客户端发送请求时,用来指定服务器的域名。
    • Accept:客户端可接受的字段类型。
    • Accept-Encoding:可以接受哪些压缩方法。
    • Accept-Charset:支持的字符集。
    • Accept-Language:支持的语言。
    • Authorization:包含用于验证用户代理的凭据。
    • Expect:告诉服务器客户端需要什么特定的行为。
    • From:包含发出请求的用户的电子邮件地址。
    • If-Match:只有在ETag与客户端指定的值匹配时,才执行请求操作。
    • If-Modified-Since:只有在自从指定日期以来资源未被修改时,才执行请求操作。
  • 响应头字段:

    • Content-Lengt:回应的数据长度。
    • Content-Type:告诉客户端,本次数据是什么格式。
    • Content-Encoding:服务器返回的数据使用了什么压缩格式
    • Accept-Ranges:告诉客户端服务器支持的范围请求。
    • ETag:提供与资源相关联的实体标记。
    • Location:告诉客户端重定向资源的位置。
    • Proxy-Authenticate:包含用于验证代理的凭据。
    • Retry-After:如果服务器暂时不可用,则告诉客户端何时再次尝试请求。
    • Server:包含服务器名称和版本号。
    • Vary:告诉缓存服务器如何匹配将来的请求。

HTTP解决粘包问题

  • 设置回车符、换行符作为 HTTP header 的边界

  • Content-Length 字段作为 HTTP body 的边界

GET 和 POST

GET 和 POST 有什么区别?

  • 语义:GET 从服务器获取指定的资源,POST 根据请求负荷(报文body)对指定的资源做出处理
  • 数据位置:GET在URL ASCII编码,POST在body 任意格式

GET 和 POST 方法都是安全和幂等的吗?

  • 「安全」:请求方法不会「破坏」服务器上的资源。
  • 「幂等」:多次执行相同的操作,结果都是「相同」的。
  • GET 方法就是安全且幂等的,可以对 GET 请求的数据做缓存,这个缓存可以做到浏览器本身上(彻底避免浏览器发请求),也可以做到代理上(如nginx),而且在浏览器中 GET 请求可以保存为书签。
  • POST会修改服务器上的资源,所以是不安全的,且多次提交数据就会创建多个资源,所以不是幂等的。所以,浏览器一般不会缓存 POST 请求,也不能把 POST 请求保存为书签。