正则

132 阅读4分钟

什么是正则RegExp

正则表达式是描述字符模式的对象。

正则表达式用于对字符串模式匹配及检索替换,是对字符串执行模式匹配的强大工具

学习和工具

可视化正则 学习

实例化RegEx对象

  1. 字面量
  2. 构造函数
//字面量
var reg = /\bis\b/g;
var str = 'he is a boy. this is a dog';
var res = str.replace(reg,'IS')
console.log('res:',res);

//构造函数
var reg = new RegExp('\\bis\\b','g')
var str = 'he is a boy. this Is a dog';
var res = str.replace(reg,'IS')
console.log('res:',res);

内置关键字

修饰符

修饰符用于执行区分大小写和全局匹配:

修饰符描述
i执行对大小写不敏感的匹配
g执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)
m执行多行匹配

元字符

元字符(Metacharacter)是拥有特殊含义的字符

元字符描述
.查找单个字符,除了换行和行结束符。
\w查找数字、字母及下划线。
\W查找非单词字符。
\d查找数字。
\D查找非数字字符。
\s查找空白字符。
\S查找非空白字符。
\b匹配单词边界。
\B匹配非单词边界。
\n查找换行符。
\r查找回车符。

方括号(范围类)

方括号用于查找某个范围内的字符

表达式描述
[abc]查找方括号之间的任何字符。
[^abc]查找任何不在方括号之间的字符。
[0-9]查找任何从 0 至 9 的数字。
[a-z]查找任何从小写 a 到小写 z 的字符。
[A-Z]查找任何从大写 A 到大写 Z 的字符。
[A-z]查找任何从大写 A 到小写 z 的字符。

查找小写a到小写z

var reg = /[a-z]/g;
var str = 'a1b2d3x4z9';
var res = str.replace(reg,'Q')//Q1Q2Q3Q4Q9

查找小写a到小写z和大写A到大写Z

var reg = /[a-zA-Z]/g;
var str = 'a1b2d3x4z9AJCID';
var res = str.replace(reg,'Q') //Q1Q2Q3Q4Q9QQQQQ

查找任何从 0 至 9 的数字

// var reg = /[0-9]/g;
// var str = '2016-09-12';
// var res = str.replace(reg,'A')AAAA-AA-AA

查找任何从 0 至 9 的数字和-

var reg = /[0-9-]/g;
var str = '2016c09c12';
var res = str.replace(reg,'A')//AAAAAAAAAA

查找任何从 0 至 9 的数字和字母d

var reg = /[0-9d]/g;
var str = '2016c09c12';
var res = str.replace(reg,'A') //AAAAcAAcAA

查找任何从 0 至 9 的数字和字母c

var reg = /[0-9c]/g;
var str = '2016c09c12';
var res = str.replace(reg,'A') //AAAAAAAAAA

查找指定字符abc

var reg = /[abc]/g;
var str = 'a1b2c3d4';
var res = str.replace(reg,'X') //X1X2X3d4

查找指定字符非abc

var reg = /[^abc]/g;
var str = 'a1b2c3d4';
var res = str.replace(reg,'X') //'aXbXcXXX'

量词

表达式描述
n+匹配任何包含至少一个 n 的字符串。例如,/a+/ 匹配 "candy" 中的 "a","caaaaaaandy" 中所有的 "a"。
n*匹配任何包含零个或多个 n 的字符串。例如,/bo*/ 匹配 "A ghost booooed" 中的 "boooo","A bird warbled" 中的 "b",但是不匹配 "A goat grunted"。
n?匹配任何包含零个或一个 n 的字符串。例如,/e?le?/ 匹配 "angel" 中的 "el","angle" 中的 "le"。
n{X}匹配包含 X 个 n 的序列的字符串。例如,/a{2}/ 不匹配 "candy," 中的 "a",但是匹配 "caandy," 中的两个 "a",且匹配 "caaandy." 中的前两个 "a"。
n{X,}X 是一个正整数。前面的模式 n 连续出现至少 X 次时匹配。例如,/a{2,}/ 不匹配 "candy" 中的 "a",但是匹配 "caandy" 和 "caaaaaaandy." 中所有的 "a"。
n{X,Y}X 和 Y 为正整数。前面的模式 n 连续出现至少 X 次,至多 Y 次时匹配。例如,/a{1,3}/ 不匹配 "cndy",匹配 "candy," 中的 "a","caandy," 中的两个 "a",匹配 "caaaaaaandy" 中的前面三个 "a"。注意,当匹配 "caaaaaaandy" 时,即使原始字符串拥有更多的 "a",匹配项也是 "aaa"。
n$匹配任何结尾为 n 的字符串。
^n匹配任何开头为 n 的字符串。
?=n正向前瞻:匹配任何其后紧接指定字符串 n 的字符串。
?!n负向前瞻:匹配任何其后没有紧接指定字符串 n 的字符串。

?0个或1个

var reg = /a?/ 
var str = 'bc'; //xbc
var str = 'abc'; //xbc
var str = 'aaabc'; //xaabc

+1个或多个

// var reg = /a+/
// var str = 'bc'; //bc
// var str = 'abc'; //xbc
// var str = 'aaabc'; //xbc

*0个或1个或多个

// var reg = /a*/
// var str = 'bc'; //xbc
// var str = 'abc'; //xbc
// var str = 'aaabc'; //xbc

正向前瞻

查找单词字符开头,并下一个字符是数字

// 单词字符包括字母数字下划线
var reg = /\w(?=\d)/g //找到第一个单词字符的时候,看一下他后面的一位是不是数字,但是只替换单词
var str = 'a2*3'; //x2*3
// var str = 'a2*34v8'; //x2*x4x8
var res = str.replace(reg,'X')
console.log('res:',res); 

负向前瞻

查找单词字符开头,并下一个字符不是数字

var reg = /\w(?!\d)/g
var str = 'a2*34vv';
var res = str.replace(reg,'X') //ax*3xxx
console.log('res:',res); 

边界

// ^ 以xxx开始
// $ 以xxx结束
// \b 单词边界
// \B 非单词边界
// var reg = /is/g;  //Thx x a boy
// var reg = /\bis/g; //This x a boy
// var reg = /\Bis/g; //Thx is a boy
// var str = 'This is a boy';
var reg = /@./g;    //X23Xbc@
var reg = /^@./g;   //X23@abc@
var reg = /.@/g;   //@12QabX
var reg = /.@$/g;  //@123@abX

var str = '@123@abc@';
var res = str.replace(reg,'X')

贪婪和非贪婪

贪婪模式

var reg = /\d{3,6}/g;  //数字匹配3到6次,尽量多的匹配,在这是6次
var str = '12345678';
var res = str.replace(reg,'X')
console.log('res:',res); //x78,123456是6个数字,把这6个数字匹配成x

非贪婪模式

var reg = /\d{3,6}?/g;
var str = '12345678';
var res = str.replace(reg,'X')
console.log('res:',res); //xx78,3个一组匹配,尽量少的匹配, 123->x 456->x

分组

        var reg = /[a-z]\d{3}/g //a1b2c3d4
        var reg = /([a-z]\d){3}/g //xxxd4
        var str = 'a1b2c3d4'; 
        var res = str.replace(reg,'X')

        var reg = /Byron|Casper/g
        var str = 'ByronCasper'; //XX
        var res = str.replace(reg,'X')
        var reg = /Byr(on|Ca)sper/g
        var str = 'ByronsperByrCasper';
        var res = str.replace(reg,'X')  //XX

反向引用

        var reg = /(\d{4})-(\d{2})-(\d{2})/g
        var str = '2016-12-25';
        var res = str.replace(reg,'$2/$3/$1')
        console.log('res:',res); //12/25/2016

转义

非关键字
a   a
关键字
.   \.     //.属于关键字代表所有字符,此时代表只匹配 .