正则表达式

153 阅读1分钟

正则表达式是记录文本规则的代码。在一般情况下说某个字符串匹配某个正则表达式,通常是指这个字符串里有一部分或几部分能满足表达式给出的条件。

元字符

表达式对应匹配的代码
\b单词的开头或结尾,即单词的分界处。
.除了换行符意外的任意字符
\d匹配一个数字。可以简写 \d\d 为 \d{2}
\s任意空白符,包括空格,制表符(tab),换行符,中文全角空格
\w字母、数字、下划线、汉字
匹配字符串的开始,用来查找字符串的开头
$匹配字符串的结束
字母忽略大小写

常用限定符

表达式对应匹配的代码
*数量--在*前面的内容可以连续重复使用任意次以使整个表达式得以匹配
+匹配1次或多次
?重复n次
{n}重复n次
{n,}重复n次或更多次
{n,m}重复n到m次

常用组合

表达式对应的含义
.*连在一起代表任意数量但不包含换行的字符
\d+匹配1次或更多连续的数字
^\d{5,12}$输入的必须是5到12个数字
\当要查找字符本身时加上\,比如说网站中的.就用.来匹配