正则表达式之【贪婪匹配】和【懒惰匹配】

287 阅读1分钟

例子:匹配 HTML 标签

贪婪匹配: <.+>
在这里插入图片描述

懒惰匹配: <.+?>
在这里插入图片描述
我们发现第二种 懒惰匹配才是我们想要的结果

字符" ? " :  *如果紧跟在任何量词 、 +、? 或 {} 的后面,将会使量词变为非贪婪(懒惰匹配,匹配尽量少的字符),和缺省使用的贪婪模式(匹配尽可能多的字符)正好相反。例如,对 “123abc” 使用 /\d+/ 将会匹配 “123”,而使用 /\d+?/ 则只会匹配到 “1”。

分析匹配 HTML 标签的例子:
贪婪匹配:<.+> 表示匹配 符号 “<” 和符号 ">"之间的任意字符,且任意字符数大于0 。因为是尽可能多的匹配,所以当匹配的时候发现整个标签 “

我要匹配HTML标签
”是符合要求的,所以就是匹配所有。

懒惰匹配:<.+?> 表示匹配 符号 “<” 和符号 ">"之间的任意字符,且任意字符数大于0 。因为是尽可能少的匹配,所以当匹配的时候发现标签 “

”已经是符合要求的,所以会匹配
标签,然后继续向下匹配,发现标签也是符合要求的,继续向下匹配,发现文字不符合要求,继续向下,发现
标签都是符合要求的,所以最后会匹配
, , ,
四个标签

再看个例子: 字符串 abcdssaxd
贪婪匹配:<a.+d> 会匹配整个字符串
在这里插入图片描述
懒惰匹配:<a.+?d> 匹配 abcd 和 axd
在这里插入图片描述
懒惰匹配,匹配到满足条件的abcd就停止了此次匹配,不会干扰后面的继续匹配。