说说 Python 的贪心和非贪心匹配策略

234 阅读1分钟

Python 的正则表达式默认是“ 贪心” 匹配策略, 这表示在有二义的情况下,Python 会尽可能地匹配最长的字符串。而 “ 非贪心” 策略则是尽可能地匹配最短的字符串,它与“ 贪心” 匹配策略在写法上的区别是:在结束的花括号后跟着一个问号。

greedy_regex=re.compile(r'(AR){1,2}')
mo=greedy_regex.search('家庭ARAR演唱会来Facebook Portal TV,一展歌喉!')
print(mo.group())

no_greedy_regex=re.compile(r'(AR){1,2}?')
mo=no_greedy_regex.search('家庭ARAR演唱会来Facebook Portal TV,一展歌喉!')
print(mo.group())

运行结果:

ARAR AR

注意区分: 问号在 Python 正则表达式中有两种含义:

  • 声明非贪心匹配。
  • 表示可选的分组。