Eslint 的 fix 功能是怎么实现的

2,328 阅读3分钟

我们知道 eslint 支持 fix,当添加了 --fix 参数部分 rule 可以自动修复问题。

有没有想过,这种功能是怎么实现的? babel 也能转换代码,它和 eslint 生成代码的原理一样么?

babel

babel 分为 parse、transform、generate 3 步。

在 transform 阶段转换完 AST 代码之后,在 generate 阶段会递归打印 AST 成目标代码。

generate 的原理就是递归根据每个 AST 的信息拼接字符串:

所以我们在插件里面改动了 AST,最终的代码也会改。

eslint

eslint 的 rule 可以对 AST 进行检查,然后通过 context.report 报错,还可以指定如何修复:

自定义 rule 格式如下:

module.exports = {
     meta: {
         fixable: true
     },
     create(context) {
         return {
            // 指定 AST 的类型
            ObjectExpression(node) {
                // 一系列检查
                context.report({
                    node,
                    message: 'xxx 有错误',
                    loc: node.loc,
                    *fix(fixer) {
                        yield fixer.replaceTextRange([rangeStart,rangeEnd], '替换的文本');
                    }
                });
             }
         };
     }
 };

其中 fix 选项就是用于问题自动修复的,通过 fixer 的 api。

fixer 有这些 api 可用:

insertTextAfter(nodeOrToken, text);
insertTextAfterRange(range, text);
insertTextBefore(nodeOrToken, text);
insertTextBeforeRange(range, text);

remove(nodeOrToken);
removeRange(range);

replaceText(nodeOrToken, text);
replaceTextRange(range, text);

特别容易记,就是增、删、改 3类,增分为在前面插入和在后面插入,每一类都支持基于 token 来修改 text 或者基于 range(下标范围)。

AST 中每个节点都保留了 range 的信息,也就是在源代码的下标是从哪到哪,这样就可以根据 range 来修改代码,或者根据 AST 查到 range 再去修改代码。

那知道了对什么 range 做什么操作之后,是怎么自动修改代码的呢?

下面是 eslint 中 fix 代码的源码:

// 源码
const originalText = sourceCode.text;
// 第一个 range 的开始
const start = fixes[0].range[0];
// 最后一个 range 的结束
const end = fixes[fixes.length - 1].range[1];
// 替换的文本
let text = "";
let lastPos = Number.MIN_SAFE_INTEGER;

for (const fix of fixes) {
    if (fix.range[0] >= 0) {
        // 截取 range 的左边的字符串,从当前 range 和 上一个 range 的右边位置取大的
        text += originalText.slice(Math.max(0, start, lastPos), fix.range[0]);
    }
    // 拼接上修复的文本
    text += fix.text;
    // range 右边的位置
    lastPos = fix.range[1];
}
// 用拼接的字符串替换 range 内的字符串
text += originalText.slice(Math.max(0, start, lastPos), end);

其中比较有意思的一个点是当两端 range 有交集的时候:

每一个 fix 都是对一个线段(range)内文本的修复,当有交集的时候怎么处理,这其实可以作为一个算法题来考核候选人了。

从左到右应用 fix,然后记录当前的 rangeRight,应用下一段的时候就取 rangeLeft 和上一个 rangeRight 的最大值作为 rangeLeft。

把这个问题抽象出来之后还是一个比较有意思的算法题,我觉得用来面试比较不错,而且有真实的应用场景。

聊回正题,fix 功能的实现就是对每段 range 修改的文本进行拼接,然后替换源码字符串就可以了。

总结

babel 和 eslint 都可以修改代码,babel 是操作了 AST,打印代码的时候就会生成不同的代码,而 eslint 则是一部分 rule 支持自动 fix,当开启了 --fix 的时候就会自动修复。

babel 生成代码的原理是递归打印 AST,拼接字符串,所以改了 AST,生成的代码就改了。

eslint 修复代码的逻辑是对某段 range 的文本做替换,之后拼接,这个与 AST 无关,所以 eslint 的 fix 功能是可选的。

比较有意思的是 eslint 的多个 rule 返回的对多段range 的修改如何应用到对代码修改上,当有交集的时候怎么办,我觉得这个问题可以作为算法题来考查面试者了。