正则表达式是记录文本规则的代码。在一般情况下说某个字符串匹配某个正则表达式,通常是指这个字符串里有一部分或几部分能满足表达式给出的条件。
元字符
| 表达式 | 对应匹配的代码 |
|---|---|
| \b | 单词的开头或结尾,即单词的分界处。 |
| . | 除了换行符意外的任意字符 |
| \d | 匹配一个数字。可以简写 \d\d 为 \d{2} |
| \s | 任意空白符,包括空格,制表符(tab),换行符,中文全角空格 |
| \w | 字母、数字、下划线、汉字 |
| 匹配字符串的开始,用来查找字符串的开头 | |
| $ | 匹配字符串的结束 |
| 字母 | 忽略大小写 |
常用限定符
| 表达式 | 对应匹配的代码 |
|---|---|
| * | 数量--在*前面的内容可以连续重复使用任意次以使整个表达式得以匹配 |
| + | 匹配1次或多次 |
| ? | 重复n次 |
| {n} | 重复n次 |
| {n,} | 重复n次或更多次 |
| {n,m} | 重复n到m次 |
常用组合
| 表达式 | 对应的含义 |
|---|---|
| .* | 连在一起代表任意数量但不包含换行的字符 |
| \d+ | 匹配1次或更多连续的数字 |
| ^\d{5,12}$ | 输入的必须是5到12个数字 |
| \ | 当要查找字符本身时加上\,比如说网站中的.就用.来匹配 |