大型前端工程的优化方法大型前端工程的优化方法前言对于前端来讲，如果是去写一个简单页面，其实在写的过程中，很少会考虑到

大型前端工程的优化方法

前言

对于前端来讲，如果是去写一个简单页面，其实在写的过程中，很少会考虑到性能优化、错误监控这些。因为就一个页面而言，并不会对整个项目造成影响。但是就一个大型合作的前端项目而言，如果每个人不考虑性能优化的话，轻一点的问题就是：页面卡顿，操作不流畅。重一点的问题就是：页面卡死，内存崩溃，各种告警。所以基于了解,实践与收集，本人在此收集了大型前端项目中的一些性能优化方法，用以分享。不对地方还请斧正～

1.实现优化

1.1 容器化

所谓的容器，即对于不同的文档，打开时，不再加载重复的代码，只需加载不同的文档数据即可。容器化有两种实现思路：

1. 借助于客户端

典型场景：列表页-->选定文档-->打开文档

用户选定文档后，点击链接进行打开的时候，并不会真的去打开一个新的webview，而是进行webview的切换，APP会一直保留一个webview（代码已经加载好，是文档容器），此时将文档链接赋予容器，容器只需要拉取对应数据，不再重新加载新代码。

2. 将代码集合到一个页面中（SPA方案）

典型场景：列表页-->选定文档-->打开文档

当打开列表页后，然后迅速懒加载对应的文档容器代码。用户点击指定文档时，不再打开新的webview页面，而只是当前页面进行容器切换。用户退回列表页，仍然是在当前页面。

1.2 离线缓存

离线缓存处理的核心难点在于：离线数据的处理。离线资源处理现在一般有两种方案：

1. 借助于客户端

典型场景：打开列表页。

当网页打开请求html/js/css/图片的时候，APP拦截网络请求，查找是否命中本地的资源，命中即直接返回。此场景需要注意客户端要建立代码更新机制，更新离线代码包。

2. service workers

典型场景：打开列表页。

将资源注册后便能使用。但是必须使用https协议，同时还有 ios webview 兼容性问题。

1.3 数据序列化

典型场景：打开文档拉取后台数据的时候。

数据序列化即：将数据结构或对象编码，然后在网络间传输。

常见的协议有XML/JSON/PB等。对于一个很大的文档来言，xml或者json用来传输数据，太过于冗余。但是如果采用复杂度太高的压缩算法如：Pako.js，那这样反而提高了解压缩时间，得不偿失，所以找到一个适合的数据序列化方法至关重要。

1.4 按需加载

1.4.1 读写分离

典型场景：打开文档拉取文档代码的时候。

读写分离也是按需加载的一种形式。

读写分离即：将用户区分开来，并不是所有的用户都要加载所有的代码，读的用户只需要加载读的代码，写的用户才需要读写的代码，这样对于读的用户较为友好。

1.4.2 按需引入

典型场景：开发中进行第三方库引入。

按需引入即只引用需要的代码。

按需引入常常会在开发中被忽略。如只需要lodash中一个函数isEqual，却将整个工具库进行了引入。import _ from 'lodash' ，无形增加更多冗余代码。通过引入单个函数即可改正。import isEqual from 'lodash.isEqual'

1.5 懒加载

典型场景：文档中一些比较不常用的功能。

懒加载即：对于部分功能代码等到需要的时候再进行加载。

懒加载有利于首屏打开时间。文档中一些不常用的功能，对于用户来讲，如果每次打开都去加载对应的代码，无疑是冗余的。通过拆分代码，等到用户需要时或者点击时，再去加载对应的代码。

1.6 使用webworker

典型场景：文档中打开时有大量复杂计算时。

web worker 是运行在后台的 JavaScript，不会影响页面的性能。

web worker无疑是解决js计算能力弱的一大利器。如果将文档中复杂计算放到主线程中，页面卡顿不说，打开复杂文档的时候还很有可能崩溃掉。将计算挪入web worker中，将计算结果事件回调的方式返回，可以让用户使用更加流畅。

1.7 正则表达式

典型场景：文档中的函数或者文本进行匹配的时候。

不好的正则表达式极易引起性能问题。其核心问题在于：js 的正则匹配是基于NFA的，易引起回溯问题。

正则引擎分为 NFA（非确定性有限状态自动机），和 DFA（确定性有限状态自动机）。

DFA对于给定的任意一个状态和输入字符，DFA 只会转移到一个确定的状态。并且 DFA 不允许出现没有输入字符的状态转移。而NFA对于任意一个状态和输入字符，NFA 所能转移的状态是一个非空集合。模糊匹配、贪婪匹配、惰性匹配都会带来回溯问题。典型的正则匹配如(.*)+\d ，便会进行回溯。那么平时开发的时候，

正则要越精确越好
改用 DFA 的正则引擎

1.8 使用缓存

典型场景：一堆非常需要耗时的数据，每次更新都需要重新计算，但是更新的频率并不高。

使用缓存可以有效的减少查找时间。

js引擎是单线程的，对于大量复杂耗时的计算，会导致页面卡顿。可以通过将计算挪入worker中计算，也可以对于更新不频繁的计算进行缓存。

function complexCompute(){
  let result;
  ...
  return result;
}

对于这种复杂计算，如果每次需要用到数据的时候都要去进行计算，那就得不偿失了，通过缓存，便能有效减少计算次数。

// 加入缓存
let cache;
function complexCompute(){
  let result;
  ...
  cache = result;
  return result;
}

function getResult (){
  // 有更新的时候再进行计算
  if(update){
    complexCompute();
  }
  return cache;
}

这样便只会在更新的时候才会进行计算。

1.9 建立索引

典型场景：查找一堆复杂数据，并且每个数据都有唯一key。

建立索引的方式可以快速的提高查找速度。如一堆数据用数组进行存储。

const persons = [{name:'zhangsan',age:12},{name:'lisi',age:11}];

和用对象的方式进行存储。

const persons = {
  zhangsan: {
    age: 12,
  },
  lisi: {
    age: 11,
  }
};

进行查找zhangsan的age，那么用数组的方式进行查找的时间复杂度是o(N)，用对象的时间复杂度是o(1)。

2.架构优化

2.1 设计模式六大基本原则

五大原则和一个法则

2.1.1 单一职责原则(Single Responsibility Principle, SRP)

一个类只负责一个功能领域中的相应职责，或者可以定义为：就一个类而言，应该只有一个引起它变化的原因。

2.1.2 开闭原则(Open-Closed Principle, OCP):

一个软件实体应当对扩展开放，对修改关闭。

2.1.3 里氏代换原则(Liskov Substitution Principle, LSP)：

所有引用基类（父类）的地方必须能透明地使用其子类的对象。

2.1.4 依赖倒转原则(Dependency Inversion Principle, DIP)：

抽象不应该依赖于细节，细节应当依赖于抽象。换言之，要针对接口编程，而不是针对实现编程。

2.1.5 接口隔离原则(Interface Segregation Principle, ISP)：

使用多个专门的接口，而不使用单一的总接口，即客户端不应该依赖那些它不需要的接口。

迪米特法则(Law of Demeter, LoD)（最少知识法则）：

一个软件实体应当尽可能少地与其他实体发生相互作用。

2.2 组件库

它的核心意义在于代码复用。功能相对单一或者独立，在整个系统的代码层次上位于最底层，被其他代码所依赖。比如说我们常用的一些UI组件，逻辑组件等。组件的核心在于：

通用性
与业务无关
兼容性

通过将一些通用的UI和逻辑拆分成组件，不仅可以让代码更简洁，更容易维护，而且高内聚，低耦合。

2.3 lerna管理

当一个大的项目库代码量剧增之后，管理起来就是一件比较麻烦的事情，为了方便代码的共享，就需要将代码库拆分成独立的包。Lerna便是优化和管理JS多包项目的利器。

典型目录如下所示：

base/
  package.json
  packages/
    package-1/
      package.json
    package-2/
      package.json

2.4 享元模式

典型场景：excel的openxml规范。

享元模式（Flyweight Pattern）主要用于减少创建对象的数量，以减少内存占用和提高性能。这种类型的设计模式属于结构型模式，它提供了减少对象数量从而改善应用所需的对象结构的方式。

openxml中对于数据的管理，基本上都是用享元模式实现的。

如1个文档中有1000个相同的字符串。 excel示例

excel并不会真的就存储1000个字符串。他只会存储一个字符串。

excel示例

而具体每个格子存储的是这个字符的下标索引。

excel示例

这样无疑大大节省了存储空间。

3. 构建优化

3.1 webpack打包优化

3.1.1 公共包

webpack3是用的CommonsChunkPlugin用以实现提取第三方库和公共模块如node_modules下面的文件。

webpack

webpack4进行了改进，用optimization.splitChunks代替了CommonsChunkPlugin。 commonschunkPlugin的问题在于：它将所有的公共包合成了一个commonChunk，但是并不是所有的子模块需要这个commonChunk的所有内容。

webpack1

与CommonsChunkPlugin的父子关系思路不同的是，SplitChunksPlugin引入了chunkGroup的概念，在入口chunk和异步chunk中发现被重复使用的模块，将重叠的模块以vendor-chunk的形式分离出来，也就是vendor-chunk可能有多个，不再受限于是所有chunk中都共同存在的模块。

splitChunks是开箱即用的，常见配置如下：

  optimization: {
        splitChunks: {
            chunks: 'all',
            minSize: 20000,
            maxSize: 0,
            minChunks: 1,
            maxAsyncRequests: 6,
            maxInitialRequests: 4,
            automaticNameDelimiter: '~',
            enforceSizeThreshold: 50000,
            cacheGroups: {
                defaultVendors: {
                    test: /[\\/]node_modules[\\/]/,
                    priority: -10
                }
            }
        }
    }

可以通过cacheGroup制定更细的规则。

3.1.2 动态导入(dynamic imports)

通过动态导入进而实现懒加载和代码分离，进而可以用于获取更小的 bundle，以及控制资源加载优先级，如果使用合理，会极大影响加载时间。

当涉及到动态代码拆分时，webpack 提供了两个类似的技术。对于动态导入，第一种，也是优先选择的方式是，使用符合 ECMAScript 提案的 import() 语法。如下所示：

 return import(/* webpackChunkName: "lodash" */ 'lodash').then(_ => {
        _.join(['Hello', 'webpack']);
    })

3.1.3 tree-shaking

tree-shaking通常用于描述移除 JavaScript 上下文中的未引用代码(dead-code)。比如：

index.js

import { cube } from './math.js';
console.log(cube(5));

cube.js

export function square(x) {
  return x * x;
}

export function cube(x) {
  return x * x * x;
}

其中cube.js中的square就属于未引用代码，打包时不需要。通过在依赖包中的package.json里面写入

"sideEffects": false,

即可开启依赖包的tree-shaking。

但是使用tree-shaking要有三条规则。

使用 ES2015 模块语法（即 import 和 export）。
在项目 package.json 文件中，添加一个 "sideEffects" 入口。
引入一个能够删除未引用代码(dead code)的压缩工具(minifier)（例如 UglifyJSPlugin）。

具体的例子可以看 github.com/webpack/web… 这个。