输入url到看见页面超级详细版

138 阅读9分钟

输入URL到看见页面的过程,让面试官大吃一斤:

1. DNS 域名解析

  • 当用户在浏览器中输入一个域名时,浏览器会向本地 DNS 解析器发送一个 DNS 查询请求。本地 DNS 解析器首先会检查自己的缓存中是否有该域名对应的 IP 地址。如果有,解析器会直接返回 IP 地址给浏览器;如果没有,解析器会向根域名服务器发起查询请求。

  • 根域名服务器是全球 DNS 系统的顶级服务器,它存储了顶级域名(如.com、.org、.cn 等)的 DNS 信息。根域名服务器会告诉本地 DNS 解析器,该域名对应的顶级域名服务器的地址。

  • 本地 DNS 解析器接收到顶级域名服务器的地址后,会向顶级域名服务器发送查询请求。顶级域名服务器会告诉解析器,该域名对应的下一级域名服务器的地址。

  • 解析器继续向下一级域名服务器发送查询请求,这个过程会一直持续,直到找到存储有对应域名的 IP 地址的域名服务器。最终,解析器会将 IP 地址返回给浏览器,并将该域名和对应的 IP 地址存储在缓存中,以便下次查询时使用。

需要注意的是,DNS 缓存是有过期时间的,一旦过期,DNS 解析器就会重新向上一级服务器发送查询请求,并更新缓存中的结果。过期时间可以由域名的管理者在 DNS 记录中设置,通常是几分钟或几小时。

2. 获取 HTML

根据DNS解析后,将域名转换为IP地址,浏览器建立与Web服务器的TCP连接,向Web服务器发送HTTP请求以用来获取html内容,包括请求的方法(GET、POST等)、路径、头部信息等。

3. 渲染

解析 HTML

浏览器首先会解析 HTML 文档。

解析过程中遇到 CSS 解析 CSS,遇到 JS 执行 JS。为了提升解析效率,浏览器会在开始解析之前,启动一个预解析的 线程,率先下载HTML中的外部 CSS 文件和外部 JS 文件等。

如果主线程解析到link位置,此时外部的 CSS 文件还没有下载解析好,主线程不会等待,会继续解析后续的 HTML。这是因为下载和解析 CSS 的工作是在预解析线程中进行的。这就是 CSS 不会堵塞 HTML 解析的根本原因。

如果主线程解析到script位置,会停止解析 HTML ,转而等待 JS 文件下载好,并将全局代码解析执行完成后,才能继续解析 HTML。这是因为 JS 的代码执行过程可能会修改当前的 DOM树。

Async:异步加载这个文件(只对外部脚本文件有效)。异步下载文件,之后立即加载和异步执行文件,该过程是与后续 dom 元素的渲染过程是同时执行的。

Defer: 延迟加载这个文件(只对外部脚本文件有效)。异步下载文件,之后立即加载但延迟执行,延迟到在所有 dom 元素解析完成后,Loaded 事件触发之前才执行

样式计算

主线程会遍历等到的 DOM,依次为树中的每个节点计算出它最终的样式,称之为Computed Style

在这一过程中,很多预设值会变成绝对值,例如 red 变为 rgb(255, 0, 0);相对单位会变成绝对单位,比如 em, rem 会变为 px。

这一步骤后,会得到一颗带有样式的 DOM 树。

布局

布局阶段会依次遍历 DOM 树的每一个节点,计算每个节点的几何信息。例如节点的宽高、相对包含块的位置。

布局完成后会得到布局树(也叫渲染树,一个 C++ 对象,暴露了一部分给 JS 使用, 如 offsetWidth、 clientWidth 等)。

大部分时候, DOM 树和布局树并非一一对应。比如 display : none 的节点没有几何信息,因此不会生成到布局树;又比如使用了伪元素选择器,虽然 DOM 树中不存在这些伪元素节点,但它们拥有几何信息,所以会生成到布局树中。还有匿名行盒、匿名块盒等等都会导致 DOM 树和布局树无法一一对应。

分层

主线程会使用一套复杂的策略对整个布局树中进行分层。

渲染树中的元素会根据层级关系进行分层。

分层的好处在于,将来某一个层改变后,仅会对该层进行后续处理,从而提升效率。

滚动条、堆叠上下文、transform、opacity、filter等样式都会影响分层结果,也可以通过 will-change 更大程度的影响分层结果。

绘制

主线程会为每个单独的层产生绘制指令集,用于描述这一层的内容该如何画出来。

完成绘制后,主线程将每个图层的绘制信息提交给合成线程,剩余工作将由合成线程完成。

分块

合成线程首先对每个层级的渲染树会被分成多个块(也称为图块或者绘制命令),他会从线程池中拿取多个线程来完成分块工作。每个块对应一部分可视区域的内容。分块的目的是为了增量渲染,只渲染当前可见区域的内容,提高页面的渲染效率。

光栅化

合成线程分块完成后,将块信息交给GPU进程,以极快的速度完成光栅化。

GPU进程会开启多个线程来完成光栅化,并且预先处理靠近视口区域的块。

光栅化的结果,就是一块一块的位图。

  • 光栅化

    光栅化是将几何形状和对象转换为位图的过程。 光栅化过程涉及将几何形状转换为像素,并确定每个像素的颜色、位置和其他属性。

  • 位图

    位图是一种图像表示形式,也被称为栅格图像或点阵图像。它由一个像素阵列组成,其中每个像素都包含特定的颜色或灰度值。每个像素在位图中都有一个固定的位置,并且可以通过其坐标进行访问和操作。

    位图是一种基于像素的图像格式,它记录了图像中每个像素的信息。相比矢量图形,位图是基于像素的,并且在放大或缩小时可能会失去一些细节。位图常用于存储和显示照片、图标、绘画等图像内容。常见的位图文件格式包括 JPEG、PNG、BMP 等。

    需要注意的是,位图是由一系列离散的像素组成的,因此在对位图进行编辑或放大时,可能会出现锯齿状边缘或失真。这与矢量图形不同,矢量图形使用数学公式来描述图像,因此可以无损地进行缩放和编辑。

合成线程拿到每个层、每个块的位图后,生成一个个**指引(quad)**信息。

指引会标识出每个位图应该画到屏幕的哪个位置,以及会考虑到旋转、缩放等变形。

变形发生在合成线程,与渲染主线程无关,这就是transform高效的本质原因(不会引起重绘重排等,直接画就好)。

合成线程会把quad提交给GPU进程,由GPU进程产生系统调用,提交给CPU硬件,完成最终的屏幕成像。

  • quad

    在浏览器中,Quad(四边形)是一种用于描述屏幕上图像的基本单元。它是由四个顶点组成的平面形状,可以用于表示矩形、平行四边形或其他形状。每个顶点都包含位置、纹理坐标和其他属性的信息。

    当 GPU 进程生成位图后,它会将位图传递给合成线程。合成线程负责将位图转换为一系列 Quad。每个 Quad 包含了位图的一部分,并在屏幕上的特定位置进行渲染。合成线程将这些 Quad 组合在一起,以创建最终的图像,并将其绘制到屏幕上。

    通过使用 Quad,合成线程可以高效地处理图像的渲染和合成。它允许对位图进行分割和优化,以提高渲染性能和效率。同时,Quad 也提供了对图像进行变换、动画和交互的灵活性,使得浏览器能够提供流畅的用户体验。

什么是reflow(重排/回流)

  • reflow的本质就是重新计算 layout 树。

  • 当进行了会影响布局树的操作后,需要重新计算布局树,会引发 layout 。 为了避免连续的多次操作导致布局树反复计算,浏览器会合并这些操作,当 JS 代码全部完成后再进行统一计 算。所以,改动属性造成的 reflow 是异步完成的。 也同样因为如此,当 JS 获取布局属性时,就可能造成无法获取到最新的布局信息。 浏览器在反复权衡下,最终决定获取布局相关属性(如offsetWidth等)立即 reflow

什么是repaint(重绘)

  • repaint 的本质就是重新根据分层信息计算了绘制指令。当改动了可见样式后,就需要重新计算,会引发 repaint 。

  • 由于元素的布局信息也属于可见样式,所以 reflow 一定会引起 repaint 。

为什么 transform 的效率高?

  • 因为 transform 既不会影响布局也不会影响绘制指令,它影响的只是渲染流程的最后一个「 draw 」阶段由于 draw 阶段在合成线程,所以 transform 的变化几乎不会影响渲染主线程。反之,渲染主线程无论如何忙碌,也不会影响 transform 的变化。