Web基础
-
域名的概念
- IP地址不易记忆
-
早期使用Hosts文件解析域名
- 主机名称重复
- 主机维护困难
-
DNS(Domain Name System 域名系统)
- 分布式
- 层次性
-
网页
- 纯文本格式文件
- 编写语言为HTML
- 在用户的浏览器被“翻译” 成网页形式显示出来
-
网站
- 由一个个页面构成的,是多个网页的结合体
-
域名
- 浏览网页时输入的网址
-
HTTP
- 用来输出网页的通信协议
-
URL
- 是一种万维网寻址系统
-
浏览器
- 解释和执行源码的工具
HTML
HTML叫超文本标记语言,是一种规范,也是一种标准,它通过标记符号来标记要显示的网页中的各个部分,网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容
HTML文件可以使用任何能生存txt文件中的文本编辑器来编辑,生成超文本标记语言文件,只用修改文件名后缀为“.html”或".htm"即可
HTML基本标签
1.HMTL语言规则
HTML标签采用双标记符的形式,前后标记符对应,分别表示标记开始和结束,标记符中间的内容被标签描述,前标记符由<xxx>表示,结尾标记符由<xxx>表示
2.HMTL文本结构
HTML文件最外层由<html><html>表示,说明该文件由HTML语言描述的,里面是并列的头标签<head>和内容标签<body>
HTML 文件结构
<html>
<head> 网页的内容描述信息</head>
<body>网页显示的内容</body>
</html>
静态网页和动态网页
静态网页
在网站设计中,纯粹HTML格式的网页通常被称为“静态网页”,静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。
静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些“动态效果”只是视觉上的,与下面将要介绍的动态网页是不同的概念。
静态网页只要不修改代码,是不会改变的,每天展示的内容是一样的。静态网页只使用html语言,不使用其他高级程序语言。
动态页面
动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号——“?”。
动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。
动态网络语言
早期的动态网页主要采用通用网关接口 CGI(Common Gateway Interface)技术,虽然 CGI 技术已经发展成熟而且功能强大, 但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。
目前常用的动态网络编程语言
PHP
即Hypertext Preprocessor ( 超文本预处理器),它是当今Internet. 上 最为火热的脚本语言,其语法借鉴了C、 Java、PERL等语言,但只需要很少的编程知识你就能使用PHP建立一个真正交互的Web站点。
JSP
即Java Server Pages (Java 服务器页面X,它是由Sun Microsystem 公司于1999年6月推出的新技术,是基于Java Servlet以及整个Java体系的web开发技术。
Python
是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发。
注:Python支持的并发量不高,假设python写的脚本需要10台服务器支撑的话,Go语言只需要1台服务器。
Ruby
是一种简单快捷的面向对象( 面向对象程序设计)脚本语言,在20世纪90年代由日本人松本行弘(Yukihiro Matsumoto) 开发,遵守GPL协议和Ruby License。 它的灵感与特性来自于Perl、 Smalltalk、 Eiffel、 Ada 以及Lisp语言。
HTTP 协议概述
HTTP 已经演化出了很多版本,它们中的大部分都是向下兼容的
1.HTTP/0.9:已过时。只接受 GET 一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持 POST 方法,所以客户端无法向服务器传递太多信息。
2.HTTP/1.0:这是第一个在通讯中指定版本号的 HTTP 协议版本,至今仍被广泛采用,特别是在代理服务器中。
3.HTTP/1.1:引入了持久连接,即TCP连接默认不关闭,可以被多个请求复用,能很好地配合代理服务器工作。还支持管道方式机制,即在同一个TCP连接里面,客户端可以同时发送多个请求,以便降低线路负载,提高传输速度。
4.完全多路复用,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,而且不用按照顺序一一对应。引入了头信息压缩机制,使用gzip或compress压缩后再发送。支持服务端推送,允许服务器未经请求,主动向客户端发送资源。
| http1.0 | 相较于以前的版本可以支持POST,HEAD方法,支持HTML文件以外的前提类型,但不支持持久连接 |
|---|---|
| http1.1 | 支持持久连接,即在一个TCP连接里面完成多个http请求和相应,但是每个请求和相应是一一对应的 |
| http2.0 | 支持完全多路复用,即不光可以在一个TCP连接里面完成多个http请求和响应,而且请求和响应不用按照顺序一一对应 也支持压缩,服务端主动推送 |
| http3.0 | 基于UDP协议,效率快 |
HTTP方法
| GET | 对服务器资源获取的简单请求 |
|---|---|
| PUT | 向服务器提交数据,以修改数据 |
| DELETE | 删除服务器上的某些资源 |
| POST | 用于发送包含用户提交数据的请求 |
| HEAD | 请求页面的首部,获取资源的元信息 |
1、GET请求会向数据库发索取数据的请求,从而来获取信息,该请求不会产生副作用。无论进行多少次操作,结果都是一样的。
2、与GET不同的是,PUT请求是向服务器端发送数据的,从而改变信息,无论进行多少次PUT操作,其结果并没有不同。
3、POST请求同PUT请求类似,都是向服务器端发送数据的,但是该请求会改变数据的种类等资源,几乎目前所有的提交操作都是用POST请求的。(发送提交)
4、DELETE请求顾名思义,就是用来删除某一个资源的。
5.HEAD获取元信息,查看HTTP报文的头部
GET和POST比较
| GET | PUT |
|---|---|
| 从指定的服务器上获得数据 | 提交数据给指定服务器 |
| GET请求能被缓存 | POST请求不能被缓存 |
| GET请求会保存在浏览器的浏览记录里 | POST请求不会保存在浏览器的浏览记录里 |
| GET请求有长度的限制 | POST请求没有长度限制 |
| 主要用于获取数据 | 查询的字符串不会显示在URL中,比较安全 |
| 查询的字符串会显示在URL后缀中,不安全 |
HTTP的状态码
HTTP 状态码(HTTP Status Code)是用以表示网页服务器 HTTP 响应状态的 3 位数字代码,当浏览器请求某一 URL 时, 服务器根据处理情况返回相应的处理状态。
| 状态码首位 | 已定义范围 | 分类 |
|---|---|---|
| 1xx | 100-101 | 信息提示 |
| 2xx | 200-206 | 成功 |
| 3xx | 300-305 | 重定向 |
| 4xx | 400-415 | 客户端错误 |
| 5xx | 500-505 | 服务器错误 |
HTTP常见状态码
| 状态码 | 功能描述 |
|---|---|
| 200 | 一切正常 |
| 301 | 永久重定向 |
| 302 | 临时重定向 |
| 401 | 用户名或者密码错误 |
| 403 | 禁止访问(客户端IP地址被拒绝) |
| 404 | 请求的文件不存在 |
| 414 | 请求URI头部过长 |
| 500 | 服务器内部错误 |
| 502 | 无效网关 |
| 503 | 当前服务不可用 |
| 504 | 网管请求超时 |
如何区分动态页面和静态页面
动态页面: 以.php .jsp .asp 等为结尾的页面,页面内容是由PHP,PYTHON,JSP等高级语言开发,结合数据库实现的页面,特点页面地址带有问号
静态页面: 以.html 或.htm 为结尾的页面,文字 图片 动态图片 视频 下载文件等
HTTP请求流程分析
用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包含请求行,请求头,请求体。服务器收到请求后返回相应报文,包括相应行,相应头,相应体
请求报文
- 请求行:请求行由请求方法,URL,以及协议版本三部分组成
- 请求头:请求头为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
- 空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
- 请求体:请求体是请求提交的参数,GET 方法已经在 URL 中指明了参数,所以提交时没有数据。POST 方法提交的参数在请求体中。
| 请求头 | 描述 |
|---|---|
| Host | 接受请求的服务器地址,可以是 IP:端口号 ,也可以是域名 |
| User-Agent | 发送请求的应用程序名称 |
| Connection | 指定与连接相关的属性,如Connection:Keep-Alive |
| Accept-Charset | 通知服务端可以发送的编码格式 |
| Accept-Encoding | 通知服务端可以发送的数据压缩格式 |
| Accept-Language | 通知服务端可以发送的语言 |
响应报文
- 状态行:状态行由协议版本,状态码,状态码描述三部分组成。
- 响应头:响应头与请求头部类似,为响应报文添加了一些附加信息。
- 空行:响应头部的最后会有一个空行,表示响应头部结束。
- 响应体:服务器返回的相应 HTML 数据,浏览器对其解析后显示页面。
| 响应头 | 描述 |
|---|---|
| Server | 服务器应用程序软件的名称和版本 |
| Content-Type | 响应正文的类型(是图片还是二进制字符串) |
| Content-Length | 响应正文长度 |
| Content-Charset | 响应正文使用的编码 |
| Content-Encoding | 响应正文使用的数据压缩格式 |
| Content-Language | 响应正文使用的语言 |
http的请求流程
client(客户端)---> 域名访问,通过DNS解析I服务端P地址访问 server(服务器)
发起TCP 连接(三次握手)
发送http请求报文(请求行 请求头 请求体)
服务端回复响应报文(响应行 响应头 响应体) <---
没有保持连接的情况下 ,就会断开TCP连接(四次挥手) <---
\