【自种树自乘凉】HTTP 协议入门|8月更文挑战

446 阅读6分钟

WWW(World Wide Web)

中文即万维网

万维网不等同于互联网,万维网只是互联网所能提供的服务其中之一,是靠着互联网运行的一项服务

WWW核心三个概念:

URI:俗称网址
HTTP:基于TCP/IP协议的网络(超文本)传输协议
HTML:超文本标记语言,超文本就是指可以包含图片等非文字元素

URI 与 URL 与 URN

URI(Uniform Resource Identifier),统一资源标识符,就是方便找到资源,分为 URL 和 URN

URL( Uniform Resource Locator ),统一资源定位符,就是给我们一个地址,一般使用URL作为网址

URN( Uniform Resource Name ),统一资源名称,为每个资源取一个ISBN编号,如果要是用它,我们必须得知道这个编号,那么当然URL是首选

URL的常见组成如下:

三者的关系如下:

DNS

当输入网址后,不是说只输入网址就可以找到资源,需要找到资源对应的服务器,因为资源是从服务器获取的,必须找到该服务器的IP地址才能拿到资源,所以浏览器必须查找IP地址。

DNS就是进行网址/IP转化的。

如果没有DNS协议,那么大家就只能通过输入119.75.217.109来访问百度首页了。有了DNS我们直接输入www.baidu.com这个容易记的字母拼写即可访问。

DNS将网址翻译成对应的IP地地址,省去了直接记一串IP字母的麻烦。

DNS域名系统:输入网址后,浏览器首先发送给解析域名的服务器,这个服务器返回一串字符给客户端浏览器,然后浏览器才和服务器进行三次对话,对话结束后下载资源。

此外,可以通过命令行来找到百度的IP : nslookup baidu.com:输出 Address: 220.181.57.216,百度有很多台服务器,所以每个人输出的地址都不一样,他会找离你最近的服务器。

服务器和浏览器沟通时 http在干啥

Server + Client + http

  • 浏览器负责发起请求
  • 服务器在 80 端口接收请求( http为80端口,https为443 )
  • 服务器负责返回内容(响应)
  • 浏览器负责下载响应内容

HTTP 的作用就是指导浏览器和服务器如何进行沟通,HTTP负责规定请求报文上该怎么写,响应报文该怎么写,

当访问一个网页时,浏览器会向网页所在服务器发出请求,当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。

服务器有很多接口,每个接口有固定的用法。

请求的格式

HTTP请求:请求行、请求头部、空行和请求数据四个部分组成。

1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3 
4 要上传的数据
  1. 请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
  2. 第三部分永远都是一个回车(\n)用于区分第二部分和第四部分,第四部分可能是密码
  3. 动词有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
  4. put 整体更新,patch 局部更新
  5. 这里的路径包括「查询参数」,但不包括「锚点」
  6. 如果你没有写路径,那么路径默认为 /
  7. 第 2 部分中的 Content-Type 标注了第 4 部分的格式
  8. Host指出请求的目的地(主机域名);User-Agent是客户端的信息,它是检测浏览器类型的重要信息,由浏览器定义,并且在每个请求中自动发送

实例:

GET /mix/76.html?name=kelvin&password=123456 HTTP/1.1
Host: www.fishbay.cn
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Encoding: gzip, deflate, sdch
Accept-Language: zh-CN,zh;q=0.8,en;q=0.6

(data)

响应的格式

HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文。

1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html 第四部分的格式
3
4 要下载的内容
  1. GET 请求和 POST 请求对应的响应可以一样,也可以不一样
  2. 响应的第四部分可以很长很长很长
  3. 第 2 部分中的 Content-Type 标注了第 4 部分的格式
  4. 第 2 部分中的 Content-Type 遵循 MIME 规范
  5. 响应头是客户端可以使用的一些信息,如:Date(生成响应的日期)、Content-Type(MIME类型及编码格式)、Connection(默认是长连接)

HTTP状态码

状态码要背,是服务器对浏览器说的话。

具体如下:

  • 1xx(响应信息,表示HTTP请求已经接受,继续处理请求)

    • 101 switch protocol :切换协议,服务器根据客户端的请求切换协议
  • 2XX(响应成功,表示HTTP请求已经处理完成)

    • 200 ok :服务器已经成功处理请求 (发生强缓存时也是 200)
    • 201 created :该请求已成功,并因此创建了一个新的资源。这通常是在PUT请求之后发送的响应。(用户新建或修改数据成功)
    • 202 accept :一个请求已经进入后台,但还未响应
    • 204 no content : 服务器成功处理了请求,但不需要返回任何实体内容(用户删除成功)
  • 3XX(重定向,表示把请求访问的URL重定向到其他目录)

    • 301 move permanently:永久重定向
    • 302 Moved Temporarily:临时重定向,该资源原本确实存在,但已经被临时改变了位置
    • 304 no modified:网页上次请求没有更新,使用缓存,节省带宽和开销 (协商缓存)
    • 307 临时重定向,与302重定向有所区别的地方在于,收到307响应码后,客户端应保持请求方法不变向新的地址发出请求
  • 4XX(客户端请求出错,表示客户端出现错误)

    • 400 bad request : 服务器不理解请求的语法
    • 401 unauthorized : 用户没有权限(用户名,密码输入错误)
    • 403 forbidden : 用户得到授权(401相反),但是访问被禁止
    • 404 not found : 服务器找不到请求的网页
    • 408 request timeout : 请求超时,客户端没有在服务器预备等待的时间内完成一个请求的发送。
  • 5XX(服务器发生内部错误,表示服务端出现错误)

    • 500 interval server error : 服务器遇到未知错误,无法处理请求
    • 501 not implemented :此请求方法不被服务器支持且无法被处理,只有GETHEAD是要求服务器支持的
    • 503 service unavailable : 服务器目前无法使用(超载或停机维护)
    • 505 http version not support :服务器不支持请求的HTTP协议的版本,无法完成处理