Web基础与HTTP协议(如何访问网站)

166 阅读6分钟

静态网页与动态网页

静态网页

在网站设计中,纯粹HTML格式的网页通常被称为“静态网页”,静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些“动态效果”只是视觉上的。静态网页只要不修改代码,是不会改变的,每天展示的内容是一样的。静态网页只使用html语言,不使用其他高级程序语言。

简单来说静态网页的内容不会随着时间的推移而改变

动态网页

动态网页是指跟静态网页相对的一种网页编程技术,静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了——除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。

动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号——“?”。

简单来说动态网页的内容会随着时间的推移而发生改变,如游戏页面

常用动态网页编程语言

php

即Hypertext Preprocessor ( 超文本预处理器),它是当今Internet. 上 最为火热的脚本语言,其语法借鉴了C、 Java、PERL等语言,但只需要很少的编程知识你就能使用PHP建立一个真正交互的Web站点。

jsp

即Java Server Pages (Java 服务器页面X,它是由Sun Microsystem 公司于1999年6月推出的新技术,是基于Java Servlet以及整个Java体系的web开发技术。

python

是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发。

ruby

是一种简单快捷的面向对象( 面向对象程序设计)脚本语言,在20世纪90年代由日本人松本行弘(Yukihiro Matsumoto) 开发,遵守GPL协议和Ruby License。 它的灵感与特性来自于Perl、 Smalltalk、 Eiffel、 Ada 以及Lisp语言。

HTML概述

html又叫h5,超文本标记语言,是一种规范,也是一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容。 HTML命令可以说明文字,图形、动画、声音、表格、链接等。

文件结构

HTML文件最外层由< html> < /html>表示,说明该文件是用HTML语言描述的。在它里面是并列的头标签(< head>)和内容标签(< body>)。

image.png

HTTP协议

HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容

HTTP协议版本

  • http 1.0:相较以前版本可以支持POST、HEAD方法,支持HTML文件以外的其他类型,但不支持持久连接

  • http 1.1:支持持久连接,即在一个TCP连接里面完成多个http请求和响应,但是每个请求和响应是按照顺序一一对应的

  • http 2.0: 支持完全多路复用,即不光可以在在一个TCP连接里面完成多个http请求和响应,而且请求和响应不用按照顺序一一对应,也支持压缩,服务端主动推送

  • http 3.0:基于UDP协议

HTTP方法

HTTP 支持几种不同的请求命令,这些命令被称为 HTTP 方法(HTTP method)。每条 HTTP 请求报文都包含一个方法, 告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是 GET、POST、PUT.

image.png

HTTP状态码

HTTP 状态码(HTTP Status Code)是用以表示网页服务器 HTTP 响应状态的 3 位数字代码,当浏览器请求某一 URL 时, 服务器根据处理情况返回相应的处理状态。 通常正常的状态码为2xx,3xx(如200),如果出现异常会返回4xx,5xx(如404) 微信图片_20220920231049.jpg

若出现4XX,则客户端发生错误, 401用户/密码错误 *403访问被拒绝 *404文件不存在

若出现5XX,则服务端发生错误,500服务器内部错误 *502无效网关 *504网关请求超时

HTTP请求流程

用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。

image.png

请求报文

  • 请求行:请求行由请求方法、URL 以及协议版本三部分组成
  • 请求头:请求头为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
  • 空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少
  • 空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少

响应报文

  • 状态行:状态行由协议版本,状态码,状态码描述三部分组成
  • 响应头:响应头与请求头部类似,为响应报文添加了一些附加信息
  • 空行:响应头部的最后会有一个空行,表示响应头部结束
  • 响应体:服务器返回的相应 HTML 数据,浏览器对其解析后显示页面

HTTP访问过程详解

image.png

  1. 客户端通过域名进行访问,先进行DNS域名解析。
  2. 客户端请求与web服务器建立TCP连接(三次握手)
  3. 建立连接后,客户端向web服务器发送一个HTTP请求
  4. 服务器响应HTTP请求,客户端的浏览器得到HTML代码。
  5. 浏览器解析HTML代码,并请求HTML代码中的资源。
  6. 断开TCP连接(四次挥手),浏览器对页面进行渲染呈现给用户。