正则表达式全集整理

2,028 阅读3分钟

今天想说说开发中哪些积累的正则表达式知识点。

一、正则表达式的基本语法:

var expression = /pattern(模式)/flags(标识符);

pattern(模式)可以是由字符类、限定符、分组、向前查找以及反向引用。flags(标识符)取值为:i(不区分大小写),g(全局匹配),m(多行匹配),同一个正则表达式可以带有一个或多个flags。

二、如何创建正则表达式

1.字面量创建

代码如下:

//匹配字符串中所有“at”的实例
var e = /at/g;
//匹配第一个“bat”或“cat”,不区分大小写
var e = /[bc]at/i;

2.RegExp构造函数创建

RegExp构造函数接收两个参数,第一个参数是要匹配的字符串模式,第二个是可选的标识符字符串。 代码如下:

//匹配第一个“bat”或“cat”,不区分大小写
var e = new RegExp("[bc]at","i");

两种创建方式的比较

在ECMAScript3中,字面量创建和RegExp对象创建区别是:字面量创建始终会共享同一个RegExp实例,而构造函数创建的每一个RegExp实例都是一个新实例 ECMAScript5明确规定:使用正则表达式字面量必须像直接调用RegExp构造函数一样,每次都创建新的RegExp实例。IE9+、Firefox 4+和Chrome都做出了修改。

需要注意的是,正则表达式中的元字符必须转义。元字符有:

( [ { \ ^ $ | ) ? * + . ] }

例如:

//匹配第一个“[bc]at”,不区分大小写
var e = /\[bc\]at/i;
//在RegExp构造函数创建时,元字符需要双重on转义
var e = new RegExp("\\[bc\\]at","i");

三、RegExp实例的属性和方法

RegExp 实例属性

  • ignoreCase 返回布尔值,表示RegExp对象是否具有标志 i
  • global 返回布尔值,表示RegExp对象是否具有表示 g
  • multiline 返回布尔值,表示RegExp对象是否具有表示 m
  • lastIndex 一个整数,标识开始下一次匹配的字符位置
  • soure 返回正则表达式的原文本 (不包括反斜杠)
  • i 执行对大小写不敏感的匹配
  • g 执行全局匹配 (查找所有匹配而非在找到第一个匹配后停止)
  • m 执行多行匹配

字符类匹配

  • [...]查找方括号之间的任何字符
  • [^..]查找任何不在方括号之间的字符
  • [a-z]查找任何从小写a到小写z的字符
  • [A-Z]查找任何从大写A到大写Z的字符
  • [A-z]查找任何从大写A到小写z的字符
  • . 查找单个字符,除了换行和行结束符
  • \w 查找单词字符,等价于 [a-zA-Z0-9]
  • \W 查找非单词字符,等价于 [^a-zA-Z0-9]
  • \s 查找空白字符
  • \S 查找非空白字符
  • \d 查找数字,等价于[0-9]
  • \D 查找非数字字符,等价于[^0-9]
  • \b 匹配单词边界
  • \r 查找回车符
  • \t 查找制表符
  • \0 查找NULL字符
  • \n 查找换行符

重复字符匹配

  • {n,m}匹配前一项至少n次,但不能超过m次
  • {n,}匹配前一项n次或更多次
  • {n}匹配前一项n次
  • n?匹配前一项0次或者1次,也就是说前一项是可选的,等价于{0,1}
  • n+匹配前一项一次或多次,等价于{1,}
  • n*匹配前一项0次或多次,等价于{0,}
  • n$匹配任何结尾为n的字符串
  • ^n匹配任何开头为n的字符串
  • ?=n匹配任何其后紧接指定字符串n的字符串
  • ?!n匹配任何其后没有紧接指定字符串n的字符串

匹配特定数字

  • ^[1-9]\d*$ 匹配正整数
  • ^-[1-9]\d*$ 匹配负整数
  • ^-?[0-9]\d*$ 匹配整数
  • ^[1-9]\d*|0$ 匹配非负整数(正整数 + 0)
  • ^-[1-9]\d*|0$ 匹配非正整数(负整数 + 0)
  • ^[1-9]\d*.\d*|0.\d*[1-9]\d*$ 匹配正浮点数
  • ^-([1-9]\d*.\d*|0.\d*[1-9]\d*)$ 匹配负浮点数
  • ^-?([1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0)$ 匹配浮点数
  • ^[1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0$ 匹配非负浮点数(正浮点数 + 0)
  • ^(-([1-9]\d*.\d*|0.\d*[1-9]\d*))|0?.0+|0$ 匹配非正浮点数(负浮点数 + 0)

四、正规则表达式有哪些方法?

1.exec()方法

exec()方法为模式的捕获组而设计的,该方法接收一个参数,即要匹配的字符串,该方法返回一个包含捕获组的数组Array,如果没有捕获组匹配返回null。返回的数组Array中,第一项是与整个模式匹配的字符串,其他项是与模式中的捕获组匹配到的字符串。数组Array中还有两个参数input(返回要匹配的字符串),index(返回匹配项在字符串中的位置) 模式中的捕获组就是指圆括号中的字符串。

exg:

var e = /do(es)(d)?/;
e.exec("ssdoesdo");
/**
array[0]:"doesd",
array[1]:"es",
array[2]:"d",
index:2,
input:"ssdoesdo"
**/

例子中,模式中包含两个捕获组”es”、”d”,即圆括号中的字符串。

2.test()方法

test()方法检索字符串中指定的值,该方法接收一个参数,如果字符串中含有与模式匹配的文本则返回true,否则返回false。

exg:

var e = /do(es)?/;
e.test("doesdo");
//true

如果正则表达式中带有g标识符,则每一次调用test方法和exec方法都从上一次匹配结束位置开始匹配;如果正则表达式中没有g标识符,则每次调用方法都从字符串起始位置开始匹配。

exg:

var e = /do(es)?/g;
e.exec("ssdoesdoesdoes");
/*
array[0]:"does",
array[1]:"es",
index:2,
input:"ssdoesdoesdoes"
*/
e.exec("ssdoesdoesdoes");
/*
array[0]:"does",
array[1]:"es",
index:6,
input:"ssdoesdoesdoes"
*/
var e = /do(es)?/g;
console.log(e.test("ssdoesdoesdoes"));
console.log(e.lastIndex);
//true
//6
console.log(e.test("ssdoesdoesdoes"));
console.log(e.lastIndex);
//true
//10
console.log(e.test("ssdoesdoesdoes"));
console.log(e.lastIndex);
//true
//14
var e = /do(es)?/;
console.log(e.test("ssdoesdoesdoes"));
console.log(e.lastIndex);
//true
//0
console.log(e.test("ssdoesdoesdoes"));
console.log(e.lastIndex);
//true
//0

当然,还有其他方法,这里只列举了常用的两种方法。

五、常用的几种正则校验表达式

1.匹配手机号

/^1[34578]\d{9}$/

2.匹配座机号

/^(([0\+]\d{2,3}-)?(0\d{2,3})-)(\d{7,8})(-(\d{3,}))?$/

3.匹配正整数

/^[0-9]\d*$/

4.匹配ip地址

/^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$/

5.匹配邮箱

/^(\w-*\.*)+@(\w-?)+(\.\w{2,})+$/

6.匹配身份证

/^(\d{14}|\d{17})(\d|[xX])$/

以上,感谢你的阅读和时间,如果这篇小结对你有用,不妨顺手点个赞哦👍,你的鼓励将是我分享的动力!哈哈哈

📢 update 同步更新

掘金专栏 | 知乎专栏 | Github | 简书专栏 | CSDN | segmentfault