antlr4 正则表达式生成器4解决其他问题

307 阅读1分钟

1、解决头部带有^和尾部带$

生成ipv4 地址

^(25[0-5]|2[0-4]\d|[0-1]?\d?\d)\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)$

// ipv4
System.out.println(RegexUtil.gen("^(25[0-5]|2[0-4]\d|[0-1]?\d?\d)\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)$"))

生成结果如下:

^255\.250\.204\.103$

由于我们的正则生成器,所有对于头部和尾部约束可以删除处理

if (regex.startsWith("^")) {
    regex = regex.substring(1);
}
if (regex.endsWith("$")) {
    regex = regex.substring(0,regex.length()-1);
}

生成结果如下:

253\.254\.230\.200

2、解决上面多了\问题

. 树的遍历如下:

image.png

所以关键问题是找打 SingleCharEsc 的处理

image.png

很显然对于这个字符的处理,. 结果只需要返回 .即可 跳过第一个字符即可。

public String visitCharClassEsc(regexParser.CharClassEscContext ctx) {

    // 单字符
    if (ctx.SingleCharEsc() != null) {
        negRecords.add(new String[]{ctx.SingleCharEsc().getText().substring(1),ctx.SingleCharEsc().getText().substring(1)});
        return ctx.SingleCharEsc().getText().substring(1);
    }

最终生成结果如下:

30.86.200.251

3、总结

对于正则表达式生成,使用antlr4 来生成效率比较低,建议使用

github.com/curious-odd…

github.com/GitHub-Lazi…