python爬虫笔记(五):实战(一)re库

275 阅读1分钟

re库介绍

正则表达式(由字符和操作符)的语法:

juejin.cn/post/684490…

re库的基本使用:

主要用来字符匹配。

import re
match = re.match(r'[1-9]\d{5}', '471003')
if match:
    print(match.group(0))

re库的match对象

import re

m = re.search(r'[1-9]\d{5}', 'BIT471003 BIT247711')

#属性操作
print(m.string)
print(m.re)
print(m.pos)
print(m.endpos)

#方法操作
print(m.group(0))
print(m.start())
print(m.end())

re库的贪婪匹配和最小匹配

import re

m = re.search(r'PY.*N', 'PYANBNCNDN')#默认贪婪匹配
print(m.group(0))
#result
#PYANBNCNDN
import re

m = re.search(r'PY.*?N', 'PYANBNCNDN')#设置为最小匹配
print(m.group(0))
#result
#PYAN