1. 概念
HTTP(hypertext transport protocol)协议;中文叫超文本传输协议,是一种基于TCP/IP的应用层通信协议。
这个协议详细规定了 浏览器 和万维网 服务器 之间互相通信的规则。
协议中主要规定了两个方面的内容
- 客户端:用来向服务器发送数据,可以被称之为请求报文
- 服务端:向客户端返回数据,可以被称之为响应报文
报文:可以简单理解为就是一堆字符串
2. 请求报文组成
- 请求行
- 请求头
- 空行
- 请求体
3. HTTP的请求行
-
请求方法(get、post、put、delete等)
-
请求 URL(统一资源定位器)
例如:www.baidu.com:80/index.html?…
- http: 协议(https、ftp、ssh等)
- www.baidu.com 域名
- 80 端口号
- /index.html 路径
- a=100&b=200 查询字符串
- #logo 哈希(锚点链接)
-
HTTP协议版本号
4. HTTP请求头
格式:『头名:头值』
常见的请求头有:
| 请求头 | 解释 |
|---|---|
| Host | 主机名 |
| Connection | 连接的设置keep-live(保持连接);close(关闭连接) |
| Cache-Control | 缓存控制 max-age = 0 (没有缓存) |
| Upgrade- Insecure- Requests | 将网页中的http请求转化为https请求(很少用)老网站升级 |
| User-Agent | 用户代理,客户端字符串标识,服务器可以通过这个标识来识别这个请求来自 哪个客户端 ,一般在PC端和手机端的区分 |
| Accept | 设置浏览器接收的数据类型 |
| Accept-Encoding | 设置接收的压缩方式 |
| Accept- Language | 设置接收的语言 q=0.7 为喜好系数,满分为1 |
| Cookie | 后面单独讲 |
5. HTTP的请求体
请求体内容的格式是非常灵活的,
(可以是空)==> GET请求,
(也可以是字符串,还可以是JSON)===> POST请求
例如:
- 字符串:keywords=手机&price=2000
- JSON:{"keywords":"手机","price":2000}
6. 响应报文的组成
-
响应行
HTTP/1.1 200 OK-
HTTP/1.1:HTTP协议版本号
-
200:响应状态码 404 Not Found 500 Internal Server Error
还有一些状态码,参考:developer.mozilla.org/zh-CN/docs/…
-
OK:响应状态描述
响应状态码和响应字符串关系是一一对应的。
-
-
响应头
Cache-Control:缓存控制 private 私有的,只允许客户端缓存数据 Connection 链接设置 Content-Type:text/html;charset=utf-8 设置响应体的数据类型以及字符集,响应体为html,字符集 utf-8 Content-Length:响应体的长度,单位为字节 -
空行
-
响应体
响应体的内容是 非常灵活的,常见的类型有HTML、CSS、JS、图片、JSON
7. 创建HTTP服务
使用nodejs创建HTTP服务
7-1 操作步骤
//1. 导入 http 模块
const http = require('http');
//2. 创建服务对象 create 创建 server 服务
// request 意为请求. 是对请求报文的封装对象, 通过 request 对象可以获得请求报文的数据
// response 意为响应. 是对响应报文的封装对象, 通过 response 对象可以设置响应报文
const server = http.createServer((request, response) => {
response.end('Hello HTTP server');
});
//3. 监听端口, 启动服务
server.listen(9000, () => {
console.log('服务已经启动, 端口 9000 监听中...');
});
http.createServer 里的回调函数的执行时机:
当接收到 HTTP 请求的时候,就会执行
7-2 测试
浏览器请求对应端口
http://127.0.0.1:9000
7-3 注意事项
-
命令行
Ctrl + c停止服务 -
当服务启动后,更新代码
必须重启服务后才能生效 -
响应内容中文乱码的解决办法
response.setHeader('content-type','text/html;charset=utf-8'); -
端口号被占用
Error: listen EADDRINUSE: address already in use :::9000- 关闭当前正在运行监听端口的服务 (
使用较多) - 修改其他端口号
- 关闭当前正在运行监听端口的服务 (
-
HTTP 协议默认端口是
80。HTTPS 协议的默认端口是443, HTTP 服务开发常用端口有 3000, 8080,8090,9000 等
如果端口被其他程序占用,可以使用
资源监视器找到占用端口的程序,然后使用任务管理器关闭 对应的程序
8. 浏览器查看HTTP报文
点击步骤
8-1 查看请求行和请求头
8-2 查看请求体
8-3 查看URL查询字符串
8-4 查看响应行与响应头
8-5 查看响应体
9. 获取HTTP请求报文
想要获取请求的数据,需要通过 request 对象
| 含义 | 语法 | 重点掌握 |
|---|---|---|
| 请求方法 | request.method | * |
| 请求版本 | request.httpVersion | |
| 请求路径 | request.url | * |
| URL路径 | require('url').parse(request.url).pathname | * |
| URL 查询字符串 | require('url').parse(request.url, true).query | * |
| 请求头 | request.headers | * |
| 请求体 | request.on('data', function(chunk){}) request.on('end', function(){}); |
注意事项:
- request.url 只能获取路径以及查询字符串,无法获取 URL 中的域名以及协议的内容
- request.headers 将请求信息转化成一个对象,并将属性名都转化成了『小写』
- 关于路径:如果访问网站的时候,只填写了 IP 地址或者是域名信息,此时请求的路径为『
/』 - 关于 favicon.ico:这个请求是属于浏览器自动发送的请求
9-1. 练习
按照以下要求搭建 HTTP 服务
| 请求类型(方法) | 请求地址 | 响应体结果 |
|---|---|---|
| get | /login | 登录页面 |
| get | /register | 注册页面 |
//1、引入http模块
const http = require("http");
//2、建立服务
const server = http.createServer((request,response)=>{
// 获取请求的方法
let {method} = request; //对象的解构赋值
// 获取请求的URL路径
let {pathname} = new URL(request.url,'http://127.0.0.1');
//设置响应头信息
//解决中文乱码
response.setHeader("Content-Type","text/html;charset=utf-8")
// 判断
if(pathname === "/register" && method == "GET"){
response.end("注册页面");
}else if(pathname==="/login" && method == "GET"){
response.end("登录页面");
}else{
response.end("<h1>404 Not Found</h1>")
}
});
//3、监听端口
server.listen(8000,()=>{
console.log('服务启动中....');
})
10. 设置HTTP响应报文
| 作用 | 语法 |
|---|---|
| 设置响应状态码 | response.statusCode |
| 设置响应状态描述 | response.statusMessage ( 用的非常少 ) |
| 设置响应头信息 | response.setHeader('头名', '头值') |
| 设置响应体 | response.write('xx') response.end('xxx') |
write 和 end 的两种使用情况:
//1. write 和 end 的结合使用 响应体相对分散
response.write('xx');
response.write('xx');
response.write('xx');
response.end(); //每一个请求,在处理的时候必须要执行 end 方法的
//2. 单独使用 end 方法 响应体相对集中
response.end('xxx');
10-1. 练习
搭建 HTTP 服务,响应一个 4 行 3 列的表格,并且要求表格有 隔行换色效果 ,且 点击 单元格能 高亮显示
const http = require('http');
//创建服务对象
const server = http.createServer((request, response) => {
response.end(`
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Document</title>
<style>
td{
padding: 20px 40px;
}
table tr:nth-child(odd){
background: #aef;
}
table tr:nth-child(even){
background: #fcb;
}
table, td{
border-collapse: collapse;
}
</style>
</head>
<body>
<table border="1">
<tr><td></td><td></td><td></td></tr>
<tr><td></td><td></td><td></td></tr>
<tr><td></td><td></td><td></td></tr>
<tr><td></td><td></td><td></td></tr>
</table>
<script>
//获取所有的 td
let tds = document.querySelectorAll('td');
//遍历
tds.forEach(item => {
item.onclick = function(){
this.style.background = '#222';
}
})
</script>
</body>
</html>
`); //设置响应体
});
//监听端口, 启动服务
server.listen(9000, () => {
console.log('服务已经启动....')
});
11. 网页资源的基本加载过程
网页资源的加载都是循序渐进的,首先获取 HTML 的内容, 然后解析 HTML 在发送其他资源的请求,如 CSS,Javascript,图片等。 理解了这个内容对于后续的学习与成长有非常大的帮助。
12. 静态资源服务
静态资源是指 内容长时间不发生改变的资源 ,例如图片,视频,CSS 文件,JS文件,HTML文件,字体文
件等
动态资源是指 内容经常更新的资源 ,例如百度首页,网易首页,京东搜索列表页面等
12-1. 网站根目录或静态资源目录
HTTP 服务在哪个文件夹中寻找静态资源,那个文件夹就是 静态资源目录 ,也称之为 网站根目录
思考:vscode 中使用 live-server 访问 HTML 时, 它启动的服务中网站根目录是谁?(其实就是你使用vscode打开的当前文件夹)
12-2. 网页中的URL
网页中的 URL 主要分为两大类:相对路径与绝对路径
12-2-1 绝对路径
绝对路径可靠性强,而且相对容易理解,在项目中运用较多
| 形式 | 特点 |
|---|---|
| atguigu.com/w eb | 直接向目标资源发送请求,容易理解。网站的外链会用到此形式 |
| //atguigu.com/web | 与页面 URL 的协议拼接形成完整 URL 再发送请求。大型网站用的比较多 |
| /web | 与页面 URL 的协议、主机名、端口拼接形成完整 URL 再发送请求。中小 型网站 |
12-2-2 相对路径
相对路径在发送请求时,需要与当前页面 URL 路径进行 计算 ,得到完整 URL 后,再发送请求,学习阶段用的较多
例如当前网页 url 为 www.atguigu.com/course/h5.h…
| 形式 | 最终的URL |
|---|---|
| ./css/app.css | www.atguigu.com/course/css/… |
| js/app.js | www.atguigu.com/course/js/a… |
| ../img/logo.png | www.atguigu.com/img/logo.pn… |
| ../../mp4/show.mp4 | www.atguigu.com/mp4/show.mp… |
12-2-3 网页中使用URL的场景小结
包括但不限于如下场景:
- a 标签 href
- link 标签 href
- script 标签 src
- img 标签 src
- video audio 标签 src
- form 中的 action
- AJAX 请求中的 URL
12-3. 设置资源类型(mime类型)
媒体类型(通常称为 Multipurpose Internet Mail Extensions 或 MIME 类型 )是一种标准,用来表示文档、文件或字节流的性质和格式。
mime 类型结构: [type]/[subType] 例如: text/html text/css image/jpeg image/png application/json
HTTP 服务可以设置响应头 Content-Type 来表明响应体的 MIME 类型,浏览器会根据该类型决定如何处理资源
下面是常见文件对应的 mime 类型
html: 'text/html', css: 'text/css', js: 'text/javascript', png: 'image/png', jpg: 'image/jpeg', gif: 'image/gif', mp4: 'video/mp4', mp3: 'audio/mpeg', json: 'application/json'
对于未知的资源类型,可以选择
application/octet-stream类型,浏览器在遇到该类型的响应时,会对响应体内容进行独立存储,也就是我们常见的下载效果
//导入 http 模块
const http = require('http');
const fs = require('fs');
const path = require('path');
// 声明一个变量
let mimes = {
html: 'text/html',
css: 'text/css',
js: 'text/javascript',
png: 'image/png',
jpg: 'image/jpeg',
gif: 'image/gif',
mp4: 'video/mp4',
mp3: 'audio/mpeg',
json: 'application/json'
};
//创建服务对象
const server = http.createServer((request, response) => {
// 获取请求URL的路径
let { pathname } = new URL(request.url, 'http://127.0.0.1');
// 指定网站根目录
let root = __dirname + 'page';
// 拼接文件路径
let filePath = root + pathname;
// 读取文件,fs 异步
fs.readFile(filePath, (err, data) => {
if (err) {
response.statusCode = 500;
response.setHeader('content-type', 'text/html;charset=utf-8'); //设置响应头
response.end('文件读取失败');
return
}
// 获取文件的后缀名
let ext = path.extname(filePath).slice(1);
// 获取对应的类型
let type = mimes[ext];
if(type) {
// 匹配到了
response.setHeader('content-type', type);
}else {
// 没有匹配到
response.setHeader('content-type', 'application/octet-stream');
}
// 响应文件内容
response.end(data);
})
});
//监听端口, 启动服务
server.listen(9000, () => {
console.log('服务已经启动....')
});
注意:虽然浏览器会自动识别响应体的mime类型,但是在代码中写了会更加规范一些。
解决乱码问题
只需在上面代码中的setHeader中拼接上字符集charset=utf-8
response.setHeader('content-type', type + ';charset=utf-8');
补充
-
在HTML的标签
meta中也可以设置字符集,那么就产生了一个问题:设置响应头中的字符集和html中meta标签的字符集,哪个优先级更高?经过验证,设置响应头中的字符集优先级
高于meta标签字符集。 -
大多数网站的相应的静态资源中,html类型的都是有字符集,而其他类型如css、js等文件都没有在响应头中设置字符集,这是因为尽管这些文件中会有中文,但是回到html页面中都会执行html中的字符集。故我们通常只需给html类型的响应文件设置字符集:
// 匹配到了 if(ext === 'html') { response.setHeader('content-type', type + ';charset=utf-8'); } else { response.setHeader('content-type', type); }
12-4. 完善错误处理
在访问静态资源时,有时会出现以下几种错误,我们可以通过返回的错误码处理
- 未找到文件:
ENOENT - 禁止访问:
EPERM - 请求方式错误(非GET)
- 未知错误
//创建服务对象
const server = http.createServer((request, response) => {
// 判断请求方式
if(request.method !== 'GET') {
response.statusCode = 405;
response.end('<h1>405 Method Not Allowed</h1>');
return
}
// 获取请求URL的路径
let { pathname } = new URL(request.url, 'http://127.0.0.1');
// 指定网站根目录
let root = __dirname + 'page';
// 拼接文件路径
let filePath = root + pathname;
// 读取文件,fs 异步
fs.readFile(filePath, (err, data) => {
if (err) {
response.setHeader('content-type', 'text/html;charset=utf-8'); //设置响应头
// 判断错误的代码
switch(err.code) {
// 未找到文件
case 'ENOENT' :
response.statusCode = 404;
response.end('<h1>404 Not Found</h1>');
// 禁止访问
case 'EPERM' :
response.statusCode = 403;
response.end('<h1>403 Forbidden</h1>');
// 未知错误
default:
response.statusCode = 500;
response.end('<h1>Internal Server Error</h1>');
}
return
}
// 获取文件的后缀名
let ext = path.extname(filePath).slice(1);
// 获取对应的类型
let type = mimes[ext];
if(type) {
// 匹配到了
response.setHeader('content-type', type);
}else {
// 没有匹配到
response.setHeader('content-type', 'application/octet-stream');
}
// 响应文件内容
response.end(data);
})
});
13. GET和POST请求
13-1. 场景小结
GET请求的情况:
- 在地址栏直接输入 url 访问
- 点击 a 链接
- link 标签引入 css
- script 标签引入 js
- video与audio引入多媒体
- img 标签引入图片
- form 标签中的 method 为 get (不区分大小写)
- ajax 中的 get 请求
POST请求的情况
- form 标签中的 method 为 post(不区分大小写)
- AJAX 的 post 请求
13-2. GET和POST请求的区别
GET 和 POST 是 HTTP 协议请求的两种方式。主要有如下几个区别:
- 作用:GET 主要用来获取数据,POST 主要用来提交数据
- 参数位置:GET 带参数请求是将参数缀到 URL 之后,在地址栏中输入 url 访问网站就是 GET 请求, POST 带参数请求是将参数放到请求体中
- 安全性:POST 请求
相对GET 安全一些,因为在浏览器中参数会暴露在地址栏 - GET 请求大小有限制,一般为 2K,而 POST 请求则没有大小限制