我是小又又,住在武汉,做了两年新媒体,准备用 6 个月时间转行前端。
今日学习目标
昨天基于搜索来基础学习 RegExp 修饰符。今天主要是基于搜索来学习 RegExp 相关匹配规则,主要是记录项,然后了解一下目前通用的几个正则使用,又是适合学习的一天,加油,小又又!!!!
字符类别(Character Classes)
| 字符 | 含义 |
|---|---|
. |
(点号,小数点) 匹配任意单个字符,但是行结束符除外:\n \r \u2028 或 \u2029。在字符集中,点( . )失去其特殊含义,并匹配一个字面点( . )。需要注意的是, m 多行(multiline)标志不会改变点号的表现。因此为了匹配多行中的字符集,可使用[^] (当然你不是打算用在旧版本 IE 中),它将会匹配任意字符,包括换行符。例如, /.y/ 匹配 yes make my day 中的 my 和 ay,但是不匹配 yes。 |
\d |
匹配任意阿拉伯数字。等价于[0-9]。例如, /\d/ 或 /[0-9]/ 匹配 B2 is the suite number. 中的 2。 |
\D |
匹配任意一个不是阿拉伯数字的字符。等价于[^0-9]。例如, /\D/ 或 /[^0-9]/ 匹配 B2 is the suite number. 中的 B。 |
\w |
匹配任意来自基本拉丁字母表中的字母数字字符,还包括下划线。等价于 [A-Za-z0-9_]。例如, /\w/ 匹配 apple 中的 a,$5.28 中的 5 和 3D 中的 3。 |
\W |
匹配任意不是基本拉丁字母表中单词(字母数字下划线)字符的字符。等价于 [^A-Za-z0-9_]。例如, /\W/ 或 /[^A-Za-z0-9_]/ 匹配 50% 中的 %。 |
\s |
匹配一个空白符,包括空格、制表符、换页符、换行符和其他 Unicode 空格。等价于 [ \f\n\r\t\v\u00a0\u1680\u180e\u2000\u2001\u2002\u2003\u2004 \u2005\u2006\u2007\u2008\u2009\u200a\u2028\u2029\u202f\u205f \u3000]。例如 /\s\w*/ 匹配 foo bar 中的 bar。 |
\S |
匹配一个非空白符。等价于 [^ \f\n\r\t\v\u00a0\u1680\u180e\u2000\u2001\u2002\u2003\u2004 \u2005\u2006\u2007\u2008\u2009\u200a\u2028\u2029\u202f\u205f\u3000]。例如, /\S\w*/ 匹配 foo bar 中的 foo。 |
\t |
匹配一个水平制表符(tab) |
\r |
匹配一个回车符(carriage return) |
\n |
匹配一个换行符(linefeed) |
\v |
匹配一个垂直制表符(vertical tab) |
\f |
匹配一个换页符(form-feed) |
[\b] |
匹配一个退格符(backspace)(不要与 \b 混淆) |
\0 |
匹配一个 NUL 字符。不要在此后面跟小数点。 |
\cX |
X 是 A - Z 的一个字母。匹配字符串中的一个控制字符。例如, /\cM/ 匹配字符串中的 control-M。 |
\xhh |
匹配编码为 hh (两个十六进制数字)的字符。 |
\uhhhh |
匹配 Unicode 值为 hhhh (四个十六进制数字)的字符。 |
\ |
对于那些通常被认为字面意义的字符来说,表示下一个字符具有特殊用处,并且不会被按照字面意义解释。例如 /b/ 匹配字符 b。在 b 前面加上一个反斜杠,即使用 /\b/,则该字符变得特殊,会匹配一个单词边界。或 对于那些通常 特殊对待的字符,表示下一个字符不具有特殊用途,会被按照字面意义解释。例如, * 是一个特殊字符,表示匹配某个字符 0 或多次,如 /a*/ 意味着 0 或多个 a。 为了匹配字面意义上的 * ,在它前面加上一个反斜杠,例如,/a\*/匹配 a*。 |
字符集合(Character Sets)
| 字符 | 含义 |
|---|---|
[xyz] |
一个字符集合,也叫字符组。匹配集合中的任意一个字符。你可以使用连字符-指定一个范围。例如, [abcd] 等价于 [a-d],匹配brisket中的b和chop中的c。 |
[^xyz] |
一个反义或补充字符集,也叫反义字符组。也就是说,它匹配任意不在括号内的字符。你也可以通过使用连字符 - 指定一个范围内的字符。例如, [^abc] 等价于 [^a-c]。 第一个匹配的是 bacon 中的o 和 chop 中的 h。 |
边界(Boundaries)
| 字符 | 含义 |
|---|---|
^ |
匹配输入开始。等价于:[\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000],如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符后的开始处。例如, /^A/ 不匹配 an A 中的 A,但匹配 An A 中的 A。 |
$ |
匹配输入结尾。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符的前的结尾处。例如, /t$/ 不匹配 eater 中的 t,但匹配 eat 中的 t。 |
\b |
匹配一个零宽单词边界(zero-width word boundary),如一个字母与一个空格之间。 (不要和 [\b] 混淆)例如, /\bno/ 匹配 at noon 中的 no,/ly\b/ 匹配 possibly yesterday. 中的 ly。 |
\B |
匹配一个零宽非单词边界(zero-width non-word boundary),如两个字母之间或两个空格之间。例如,用 /\Bno/ 匹配 at noon是匹配不到的,用/\Bon/ 匹配 at noon 中的 on,/ye\B/ 匹配 possibly yesterday. 中的 ye。 |
分组(grouping)与反向引用(back references)
| 字符 | 含义 |
|---|---|
(x) |
匹配 x 并且捕获匹配项。 这被称为捕获括号(capturing parentheses)。例如,/(foo)/ 匹配且捕获 foo bar. 中的 foo。被匹配的子字符串可以在结果数组的元素 [1], ..., [n] 中找到,或在被定义的 RegExp 对象的属性 $1, ..., $9 中找到。捕获组( Capturing groups)有性能惩罚。如果不需再次访问被匹配的子字符串,最好使用非捕获括号(non-capturing parentheses),见下面。 |
\n |
n 是一个正整数。一个反向引用(back reference),指向正则表达式中第 n 个括号(从左开始数)中匹配的子字符串。例如, /apple(,)\sorange\1/ 匹配 apple, orange, cherry, peach. 中的 apple,orange,。一个更全面的例子在该表格下面。 |
(?:x) |
匹配 x 不会捕获匹配项。这被称为非捕获括号(non-capturing parentheses)。匹配项不能够从结果数组的元素 [1], ..., [n] 或已被定义的 RegExp 对象的属性 $1, ..., $9 再次访问到。 |
数量词(Quantifiers)
| 字符 | 含义 |
|---|---|
x* |
匹配前面的模式 x 0 或多次。例如, /bo*/ 匹配 A ghost booooed 中的 boooo,A bird warbled 中的 b,但是不匹配 A goat grunted。 |
x+ |
匹配前面的模式 x 1 或多次。等价于 {1,}。例如, /a+/ 匹配 candy 中的 a,caaaaaaandy 中所有的 a。 |
x*? x+? |
像上面的 * 和 + 一样匹配前面的模式 x,然而匹配是最小可能匹配。例如, /.*?/ 匹配 foo bar 的 空格,而 * 后面没有 ? 时匹配 foo bar,即'foo bar.'.match(/.*/)的值为["foo bar.", index: 0, input: "foo bar.", groups: undefined]。 |
x? |
匹配前面的模式 x 0 或 1 次。例如, /e?le?/ 匹配 angel 中的 el,angle 中的 le。如果在数量词 *、+、? 或 {}, 任意一个后面紧跟该符号(?),会使数量词变为非贪婪(non-greedy) ,即匹配次数最小化。反之,默认情况下,是贪婪的(greedy),即匹配次数最大化。在使用于 向前断言(lookahead assertions)时,见该表格中 (?=)、(?!) 和 (?:) 的说明。 |
x(?=y) |
只有当 x 后面紧跟着 y 时,才匹配 x。 例如,/Jack(?=Sprat)/ 只有在 Jack 后面紧跟着 Sprat 时,才会匹配它。/Jack(?=Sprat|Frost)/ 只有在 Jack 后面紧跟着 Sprat 或 Frost 时,才会匹配它。然而,Sprat 或 Frost 都不是匹配结果的一部分。 |
x(?!y) |
只有当 x 后面不是紧跟着 y 时,才匹配 x。例如,/\d+(?!\.)/ 只有当一个数字后面没有紧跟着一个小数点时,才会匹配该数字。/\d+(?!\.)/.exec('3.141') 匹配 141 而不是 3.141。 |
x|y |
匹配 x 或 y例如, /green|red/ 匹配 green apple 中的 green,red apple. 中的 red。 |
x{n} |
n 是一个正整数。前面的模式 x 连续出现 n 次时匹配。例如, /a{2}/ 不匹配 candy, 中的 a,但是匹配 caandy, 中的两个 a,且匹配 caaandy. 中的前两个 a。 |
x{n,} |
n 是一个正整数。前面的模式 x 连续出现至少 n 次时匹配。例如, /a{2,}/ 不匹配 candy 中的 a,但是匹配 caandy 和 caaaaaaandy. 中所有的 a,'caaaaaaandy.'.match(/a{2,}/)的值为["aaaaaaa", index: 1, input: "caaaaaaandy.", groups: undefined]。 |
x{n,m} |
n 和 m 为正整数。前面的模式 x 连续出现至少 n 次,至多 m 次时匹配。例如, /a{1,3}/ 不匹配 cndy,匹配 candy, 中的 a,caandy, 中的两个 a,匹配 caaaaaaandy 中的前面三个 a。注意,当匹配 caaaaaaandy 时,即使原始字符串拥有更多的 a,匹配项也是 aaa,即'caaaaaaandy.'.match(/a{1,3}/)的值为["aaa", index: 1, input: "caaaaaaandy.", groups: undefined]。 |
断言(Assertions)
| 字符 | 含义 |
|---|---|
x(?=y) |
仅匹配被y跟随的x。举个例子, /Jack(?=Sprat)/,如果Jack后面跟着sprat,则匹配之。/Jack(?=Sprat|Frost)/ ,如果Jack后面跟着Sprat或者Frost,则匹配之。但是,Sprat 和Frost 都不会在匹配结果中出现。 |
x(?!y) |
仅匹配不被y跟随的x。举个例子, /\d+(?!\.)/ 只会匹配不被点(.)跟随的数字。/\d+(?!\.)/.exec('3.141') 匹配141,而不是3.141 |
特殊值正则转换表
const strString = "hello little";
const oo = new Object();
const oString = new String("hello world");
const oBool = new Boolean(true);
const oNum = new Number(68);
const oArray = new Array("demo","little","you");
const oDate = new Date();// Mon May 25 2020 21:31:56 GMT+0800 (中国标准时间)
| 原始值 | 使用方法 | 转化值 |
|---|---|---|
| true | new RegExp(true) | /true/ |
| false | new RegExp(false) | /false/ |
| undefined | new RegExp(undefined) | /(?:)/ |
| null | new RegExp(null) | /null/ |
| NaN | new RegExp(NaN) | /NaN/ |
| {} | new RegExp({}) | /[object Object]/ |
| [String: 'hello world'] | new RegExp(oString) | /hello world/ |
| [Boolean: true] | new RegExp(oBool) | /true/ |
| [Number: 68] | new RegExp(oNum) | /68/ |
| oDate | new RegExp(oDate) | /Mon May 25 2020 21:31:56 GMT+0800 (中国标准时间)/ |
Number.MAX_VALUE |
new RegExp(Number.MAX_VALUE) | /1.7976931348623157e+308/ |
Number.MIN_VALUE |
new RegExp(Number.MIN_VALUE) | /5e-324/ |
| Number.NaN | new RegExp(Number.NaN) | /NaN/ |
Number.NEGATIVE_INFINITY |
new RegExp(Number.NEGATIVE_INFINITY) | /-Infinity/ |
Number.POSITIVE_INFINITY |
new RegExp(Number.POSITIVE_INFINITY) | /Infinity/ |
常用正则表达式
- 用户名
/^[a-z0-9_-]{3,16}$/
需要以小写字母,0~9的数字,或者 _ - 符号开头和结尾,并且长度在三到十六位的字符串
- 密码
/^[a-z0-9_-]{6,18}$/
需要以小写字母,0~9的数字,或者 _ - 符号开头和结尾,并且长度在六到十八位的字符串
- 十六进制值
/^#?([a-f0-9]{6}|[a-f0-9]{3})$/
需要以#开头,或者不包含#开头,主要要求内容为小写字母(a~f)和0~9的数字,并且长度为三或者六位的字符串.
- 电子邮箱
/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/
/^[a-z\d]+(\.[a-z\d]+)*@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$/
这个有点看不太懂,大概知道是要检查为邮箱格式的 如 111@qq.com
- URL
/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/
这个有点看不太懂,大概知道是要检查为网址形式 如http://baidu.com
- IP 地址
/((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)/
/^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/
这个完全看不懂~~~~~
- HTML 标签
/^<([a-z]+)([^<]+)*(?:>(.*)<\/\1>|\s+\/>)$/
这个有点看不太懂,大概知道是要检查为成对的 html 标签形式
<html></html>
- 删除代码
\\注释
/(?<!http:|\S)//.*$/
这个完全看不懂~~~~~
Unicode编码中的汉字范围
/^[\u2E80-\u9FFF]+$/
这个完全看不懂~~~~~
参考网站
- https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions
今日学习总结
今日心情
今日主要是基于搜索来基础学习 RegExp,发现正则这边细分知识点太多了,大方向的做一下记录,主要是对几个常用的进行了学习和理解, 希望明天学到更多RegExp的内容~~~~
本文使用 mdnice 排版