正则表达式
### 定义:就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑
- 常用方法
- re.compile(编译)
- pattern.match(从头找一个)
- pattern.search(找一个)
- pattern.findall(找所有)
- pattern.sub(替换)
正则使用的注意点
re.findall("a(.*?)b",str),能够返回括号中的内容,括号前后的内容起到定位和过滤的效果- 原始字符串r,待匹配字符中有反斜杠的时候,使用r能忽略反斜杠带来的转义的效果
.(点号)默认情况匹配不到\n/s能够匹配空白字符,不仅仅包括空格,还有\t|\r|\n