HTTP请求原理
- 解析URL: 客户端解析所需访问的URL,通过DNS解析找到服务器的IP地址
- 建立TCP连接: 客户端使用解析得到的服务器地址建立一个TCP连接,完成三次握手后,连接通道建立。若使用HTTPS协议,则还会进行SSL握手,建立加密通道。使用SSL握手时,会确定是否使用HTTP2。
- 发送请求报文: 客户端构建HTTP请求报文,其中包括请求行、请求头和请求体。请求行包含请求方法(如GET、POST、PUT、DELETE等)、URL和HTTP版本。请求头包含与请求相关的附加信息,如用户代理(User-Agent)、Accept、Cookie等。请求体是可选的,通常用于POST请求发送表单数据或JSON数据。
- 服务器响应: 服务器接收到请求后,会解析请求报文并进入后端流程。服务器执行相应的操作,并构建一个HTTP响应报文作为响应。
- 接收响应报文: 服务器将构建好的HTTP响应报文发送回客户端。客户端接收到响应报文后,通过TCP连接接收数据。
- 解析响应报文: 客户端解析响应报文,提取响应行、响应头和响应体。响应行包含响应状态码(如200表示成功、404表示未找到等)和HTTP版本。响应头包含与响应相关的附加信息,如响应内容的类型、响应长度等。响应体包含实际的响应数据,如HTML页面、JSON数据等。
- 渲染页面或执行操作: 客户端根据响应的内容进行处理操作。对于HTML页面,客户端会解析并渲染页面,展示给用户。对于其他资源,如图片、CSS文件、JavaScript文件等,客户端可能会进一步发起请求以获取这些资源,并在页面中进行加载和使用。
- 关闭TCP连接: 浏览器根据使用协议的版本,以及Connectionn字段的约定,决定是否要保留TCP连接。不保留,一旦HTTP请求和响应过程完成,客户端和服务器之间的TCP连接将会关闭。
HTTP请求本身无状态,那为什么浏览器根据使用协议的版本,以及Connectionn字段的约定,可以决定是否要保留TCP连接
- HTTP协议本身是无状态的,这意味着服务器不会记住之前的请求或会话状态。每个HTTP请求都是独立的,服务器只在每次请求中提供响应,而没有关于之前请求的任何信息。然而,浏览器可以通过使用协议的版本和Connection字段的约定来决定是否保持TCP连接。HTTP/1.1引入了持久连接(Persistent Connection)的概念,允许客户端和服务器在单个TCP连接上发送多个请求和响应,而不必为每个请求都建立和关闭新的TCP连接。在使用HTTP/1.1时,默认情况下,浏览器会尝试保持TCP连接以提高性能。当一个请求的响应结束后,连接会被保持在打开状态,以便发送后续的请求。
这种保持连接的方式可以减少连接建立和关闭的开销,并且可以在一段时间内重复使用相同的连接发送多个请求,从而提高性能和效率。但是,浏览器和服务器都有权利在任何时间关闭持久连接,以便释放资源或处理其他连接。保持TCP连接的持久性是通过Connection字段来控制的。
在HTTP请求头中,可以使用Connection字段设置是否保持连接。例如,当Connection字段的值为"keep-alive"时,表示希望保持连接;当值为"close"时,表示不希望保持连接。需要注意的是,HTTP/2引入了新的协议机制,如多路复用(Multiplexing),它允许在单个TCP连接上同时发送多个请求和响应。在HTTP/2中,保持TCP连接变得更加普遍,因为多个请求可以同时进行而无需等待之前的请求完成。
综上所述,HTTP协议本身是无状态的,但通过使用协议的版本和Connection字段的约定,浏览器可以决定是否保持TCP连接,以提高性能和效率。
事件循环原理
单线程是异步产生的原因,事件循环是异步的实现方式。
事件循环又叫做消息循环,是浏览器渲染主线程的工作方式在 Chrome 的源码中,它开启一个不会结束的 for 循环,每次循环从消息队列中取出第一个任务执行,而其他线程只需要在合适的时候将任务加入到队列未尾即可。过去把消息队列简单分为宏队列和微队列,这种说法目前已无法满足复杂的浏览器环境,取而代之的是一种更加灵活多变的处理方式。根据 W3C官方的解释,每个任务有不同的类型,同类型的任务必须在同一个队列,不同的任务可以属于不同的队列。不同任务队列有不同的优先级,在一次事件循环中,由浏览器自行决定取哪一个队列的任务。但浏览器必须有一个微队列,微队列的任务一定具有最高的优先级,必须优先调度执行。
浏览器渲染原理
- 解析 HTML: 解析过程中遇到 CSS 解析 CSS,遇到 JS 执行 JS。为了提高解析效率,浏览器在开始解析前,会启动一个预解析的线程,率先下载HTML 中的外部 CSS文件和外部的JS文件。
如果主线程解析到link位置,此时外部的 CSS 文件还没有下载解析好,主线程不会等待,继续解析后续的HTML。这是因为下载和解析 CSS 的工作是在预解析线程中进行的。这就是 CSS 不会阻塞 HTML 解析的根本原因。
如果主线程解析到script位置,会停止解析 HTML,转而等待 JS 文件下载好,并将全局代码解析执行完成后,才能继续解析 HTML。这是因为 JS 代码的执行过程可能会修改当前的 DOM 树,所以 DOM 树的生成必须暂停。这就是JS会阻塞 HTML 解析的根本原因。
第一步完成后,会得到 DOM 树和 CSSOM 树,浏览器的默认样式、内部样式、外部样式、行内样式均会包含在 CSSOM 树中。
HTML里边的 CSS 由主线程解析,link里边的 CSS 由解析器解析。
主线程解析到link,CSS 下载完成:主线程把它交到样式解析器解析。走队列排队给到主线程执行
主线程解析到link,CSS 未下载完成:当 CSS 下载完成通过任务排队队列,然后主线程把它交到样式解析器解析。走队列排队给到主线程执 - 样式计算: 主线程会遍历得到的 DOM 树,依次为树中的每个节点计算出它最终的样式,称之为 Computed Style。
在这一过程中,很多预设值会变成绝对值,比如 red 会变成 rgb(255,0,0);相对单位会变成绝对单位,比如em 会变成 px 这一步完成后,会得到一棵带有样式的 DOM树 - 布局: 布局阶段会依次遍历 DOM 树的每一个节点,计算每个节点的几何信息。例如节点的宽高、相对包含块的位置。
大部分时候,DOM 树和布局树并非一一对应。
比如display:none的节点没有几何信息,因此不会生成到布局树,又比如使用了伪元素选择器,虽然 DOM树中不存在这些伪元素节点,但它们拥有几何信息,所以会生成到布局树中。还有匿名行盒、匿名块盒等等都会导致 DOM 树和布局树无法一一对应 - 分层: 主线程会使用一套复杂的策略对整个布局树中进行分层
分层的好处在于,将来某一个层改变后,仅会对该层进行后续处理,从而提升效率。
滚动条、堆叠上下文、transform、opacity 等样式都会或多或少的影响分层结果,也可以通过will-change属性更大程度的影响分层结果。 - 绘制: 主线程会为每个层单独产生绘制指令集,用于描述这一层的内容该如何画出来.
完成绘制后,主线程将每个图层的绘制信息提交给合成线程,剩余工作将由合成线程完成。
到这里主线程就不参与后续的渲染工作了,交由合成线程和其他线程处理 - 分块: 合成线程首先对每个图层进行分块,将其划分为更多的小区域。
它会从线程池中拿取多个线程来完成分块工作。
浏览器中的滚动条也是一个单独的块,由合成线程处理。 - 光栅化: 合成线程会将块信息交给 GPU 进程,以极高的速度完成光栅化。
GPU 进程会开启多个线程来完成光栅化,并且优先处理靠近视口区域的块。
光栅化的结果,就是一块一块的位图 - 画: 合成线程拿到每个层、每个块的位图后,生成一个个指引(quad)信息。
指引会标识出每个位图应该画到屏幕的哪个位置,以及会考虑到旋转、缩放等变形。
变形发生在合成线程,与渲染主线程无关,这就是 transform 效率高的本质原因。
合成线程会把quad 提交给 GPU 进程,由 GPU 进程产生系统调用,提交给 GPU 硬件,完成最终的屏幕成像。