Web基础与HTTP协议

160 阅读10分钟

image.png


Web基础

域名概述

IP地址不易记忆,所以使用了域名便于记忆和使用。

早期使用Hosts文件解析域名

  • 主机名称重复
  • 主机维护困难

DNS (Domain Name System域名系统)特点

  • 分布式
  • 层次性

域名空间结构

  • 根域
  • 顶级域
    • 组织域
    • 国家/地区域名
  • 二级域名
  • FQDN(全限定域名:同时带有主机名和域名的名称)=主机名.DNS后缀 d502db0bd6fb616e936aee7e459691c.png

网页的概念

网页

  • 纯文本格式文件
  • 编写语言为HTML
  • 在用户的浏览器中被“翻译”成网页形式显示出来

网站:由一个一个页面构成的,是多个网页的结合体
主页:打开网站后出现的第一个网页称为网站主页(或首页)
域名:浏览网页时输入的网址
HTTP:用来传输网页的通信协议
URL:是一种万维网寻址系统 image.png

HTML概述

HTML叫做超文本标记语言,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文作中添加标记符,可以告诉浏览器如何显示其中的内容。
HTML文件可以使用任何能够生成txt文件的文本编辑器来编辑,生成超文本标记语言文件,只用修改文件名后缀为" .html"或".htm"即可。
浏览器:“解释和执行”HTML源码的工具

HTML基本标签

<html>
    <head>网页的内容描述信息</head>
    <body>网页显示的内容</body>
</html>
  1. HTML语法规则 HTM标签采用双标记符的形式,前后标记符对应,分别表示标记开始和结束,标记符中间的内容被标签描述。前标记符由"<XXX>"表示,结尾标记符多了一个",由"</XXX>"表示。
  2. HTML文件结构 HTM文件最外层由<html></html>表示,说明该文件是用HTML语言描述的。在它里面是并列的头标签(<head>)和内容标签(<body>),最基本的

头标签中常用标签

标签描述
<title>定义了文档的标题
<base>定义了页面链接标签的默认链接地址
<link>定义了一个文档和外部资源之间的关系
<meta>定义了HTML文档中的元数据
<script>定义了客户端的脚本文件
<style>定义了HTML文档的样式文件

内容标签中常用标签

标签描述
<table>定义一个表格
<tr>定义了表格中的一行
<td>定义了表格中某一行的一列
<img>定义了一个图像
<a>定义了一个超链接
<p>定义了一行
<br>定义了换行
<font>定义了字体

静态网页和动态网页

静态网页

在网站设计中,纯粹HTML格式的网页通常被称为"静态网页",静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些"动态效果"只是视觉上的,并不属于动态网页。

动态网页

所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了,除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、 .php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号"?"。

动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。

image.png

动态网页语言

早期的动态网页主要采用通用网关接口OGI(Common Gateway Interface)技术,虽然CGI技术已经发展成熟而且功能强大,但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。

  • PHP 即Hypertext Preprocessor(超文本预处理器),它是当今Internet 上最为火热的脚本语言,其语法借鉴了C、Java、PERL等语言,但只需要很少的编程知识你就能使用PHP建立一个真正交互的web站点。

  • JSP 即Java Server Pages (Java 服务器页面),是基于Java Servlet以及整个Java体系的web开发技术。

  • Python 是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本,随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发。

  • Ruby 是一种简单快捷的面向对象〈面向对象程序设计)脚本语言,遵守GPL协议和RubyLicense。它的灵感与特性来自于 Perl、Smalltalk、Eiffel、Ada 以及 Lisp语言。

HTTP协议

HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。

image.png

HTTP版本

  • HTTP1.0:相较以前版本可以支持POST、HEAD方法,支持HTML文件以外的其他类型,但不支持持久连接
  • HTTP1.1:支持持久连接,即在一个TCP连接里面完成多个http请求和响应,但是每个请求和响应是按照顺序一一对应的
  • HTTP2.0:支持完全多路复用,即不光可以在在一个TCP连接里面完成多个http请求和响应,而且请求和响应不用按照顺序一一对应;也支持压缩服务端主动推送
  • HTTP3.0:基于UDP协议

HTTP方法

HTTP支持几种不同的请求命令,这些命令被称为HTTP方法。每条HTTP请求报文都包含一个方法,告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是GET、POST、PUT。

HTTP方法描述
GET对服务器资源获取的简单请求(请求、查询、下载数据)
PUT向服务器提交数据,以修改数据(提交修改数据)
DELETE删除服务器上的某些资源
POST用于发送包含用户提交数据的请求(提交上传数据)
HEAD请求页面的首部,获取资源的元信息
  • GET请求会向数据库发索取数据的请求,从而来获取信息,该请求就像数据库的select操作一样,只是用来查询一下数据,不会修改、增加数据,不会影响资源的内容,即该请求不会产生副作用。无论进行多少次操作,结果都是一样的。
  • PUT请求是向服务器端发送数据的,从而改变信息,该请求就像数据库的update操作一样,用来修改数据的内容,但是不会增加数据的种类等,也就是说无论进行多少次PUT操作,其结果并没有不同。
  • POST请求同PUT请求类似,都是向服务器端发送数据的,但是该请求会改变数据的种类等资源,就像数据库的insert操作一样,会创建新的内容。几乎目前所有的提交操作都是用POST请求的。
  • DELETE请求就是用来删除某一个资源的,该请求就像数据库的delete操作

GET和POST比较

  • GET方法:从指定的服务器上获得数据
    • GET请求能被缓存
    • GET情求会保存在浏览器的浏览纪录里
    • GET请求有长度的限制
    • 主要用于获取数据
    • 查询的字符串会显示在URL后缀中,不安全
  • POST方法:提交数据给指定服务器处理
    • POST请求不能被缓存
    • POsT请求不会保存在浏览器的浏览记录里
    • POST请求没有长度限制
    • 查询的字符串不会显示在URL中,比较安全

HTTP 状态码

HTTP 状态码是用以表示网页服务器HTTP响应状态的3位数字代码,当浏览器请求某一URL时,服务器根据处理情况返回相应的处理状态

状态码首位已定义范围分类
1xx100-101信息提示
2xx200-206成功
3xx300-305重定向
4xx400-415客户端错误
5xx500-505服务端错误

HTTP常见状态码

状态码功能描述
200一切正常
301永久重定向
302临时重定向
401用户名或密码错误
403禁止访问(客户端IP地址被拒绝)
404请求的文件不存在
414请求URI头部过长
500服务器内部错误
502无效网关
503当前服务不可用
504网关请求超时

HTTP请求流程分析

用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。

image.png

请求报文

  • 请求行:请求行由请求方法、URL 以及协议版本三部分组成。
  • 请求头:请求头为请求报文添加了一些附加信息,由"名/值"对组成,每行一对,名和值之间使用冒号分隔。空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
  • 请求体:请求体是请求提交的参数,GET方法已经在URL中指明了参数,所以提交时没有数据。POST方法提交的参数在请求体中
常用的请求头
请求头描述
Host接受请求的服务器地址,可以是IP:端口号,也可以是域名
User-Agent发送请求的应用程序名称
Connection指定与连接相关的属性
Accept-Charset通知服务端可以发送的编码格式
Accept-Encoding通知服务端可以发送的数据压缩格式
Accept-Language通知服务端可以发送的语言

响应报文

  • 状态行:状态行由协议版本,状态码,状态码描述三部分组成。
  • 响应头:响应头与请求头部类似,为响应报文添加了一些附加信息。
  • 空行:响应头部的最后会有一个空行,表示响应头部结束。
  • 响应体:服务器返回的相应HTML数据,浏览器对其解析后显示页面。

image.png

常见响应头
响应头描述
Server服务器应用程序软件的名称和版本
content-Type响应正文的类型(是图片还是二进制字符串)
content-Length响应正文长度
Content-Charset响应正文使用的编码
content-Encoding响应正文使用的数据压缩格式
content-Language响应正文使用的语言