/**
* 字符匹配
*
* 模糊匹配:
* 横向模糊匹配:一个正则可匹配的字符串的长度不是固定的,可以是多种情况的。其实现的方式是使用量词。譬如{m,n},表示连续出现最少 m 次,最多 n 次。
* 纵向模糊匹配: 一个正则匹配的字符串,具体到某一位字符时,它可以不是某个确定的字符,可以有多种可能。其实现的方式是使用字符组。譬如[abc],表示该字符是可以字符"a"、"b"、"c"中的任何一个。
*
* 字符组:虽叫字符组(字符类),但只是其中一个字符。例如[abc],表示匹配一个字符,它可以是"a"、"b"、"c"之一。
* 范围表示法:[123456abcdefGHIJKLM] 可以简写成 [1-6a-fG-M],使用了连字符"-"。
* 排除字符组:某位字符可以是任何东西,但就不能是"a"、"b"、"c",这里可以使用脱字符"^",表示求反的概念。
*
* 量词:量词也称重复。掌握{m,n}的准确含义后,只需要记住一些简写形式。
* 简写形式:
* {m,} 表示至少出现 m 次。
* {m} 等价于{m,m},表示出现 m 次。
* ? 等价于{0,1},表示出现或不出现。记忆方式:问号的意思表示,有吗?
* + 等价于{1,},表示至少出现一次。记忆方式:加号是追加的意思,得先有一个,然后才考虑追加。
* * 等价于{0,},表示出现任意次,有可能不出现。记忆方式:看看天上的星星,可能一颗没有,可能零散有几颗,可能数也数不过来。
* 贪婪匹配与惰性匹配:
* 贪婪,它会尽可能多的匹配,只要在能力范围内,越多越好。
* 惰性,就是尽可能少的匹配,通过在量词后面加个问号就能实现惰性匹配。
*
* 惰性量词 {m,n}? {m,}? ?? +? *?
* 贪婪量词 {m,n} {m,} ? + *
*
* 多选分支:多选分支可以支持多个子模式任选其一。具体形式如下:(p1|p2|p3),其中p1、p2和p3是子模式,用|(管道符)分隔,表示其中任何之一。
* 但有个事实我们应该注意,比如我用/good|goodbye/,去匹配"goodbye"字符串时,结果是"good"
*/
// 横向模糊匹配
const regexpHeng = /ab{2,4}c/g; // g 是正则的一个修饰符。表示全局匹配,即,在目标字符串中按顺序找到满足匹配模式的所有子串,强调的是“所有”,而不只是“第一个”。
const stringHeng = 'abc abbc abbbc abbbbc abbbbbc';
console.log('横向模糊匹配', stringHeng.match(regexpHeng));
// 纵向模糊匹配
const regexpZong = /a[234]b/g;
const stringZong = 'a1b a2b a3b a4b a5b';
console.log('纵向模糊匹配', stringZong.match(regexpZong));
// 范围表示法
// 需求:匹配 "a"、"-"、"c"中任意一字符
const az1 = /a\-z/;
const az2 = /-az/;
const az3 = /az-/;
// 排除字符组
// 常见的简写形式
const d = /\d/; // 表示[0-9]。表示是一位数字。记忆方式:其英文是 digit(数字)。
const D = /\D/; // 表示[^0-9]。表示除数字外的任意字符。
const w = /\w/; // 表示[0-9a-zA-Z_]。表示数字、大小写字母和下划线。记忆方式:w 是 word 的简写,也称单词字符。
const W = /\W/; // 表示[^0-9a-zA-Z_]。非单词字符。
const s = /\s/; // 表示[ \t\v\n\r\f]。表示空白符,包括空格、水平制表符、垂直制表符、换行符、回车符、换页符。记忆方式:s 是 space 的首字母,空白符的单词是 white space。
const S = /\S/; // 表示[^ \t\v\n\r\f]。非空白符。
const point = /./; // 表示[^\n\r\u2028\u2029]。通配符,表示几乎任意字符。换行符、回车符、行分隔符和段分隔符除外。记忆方式:想想省略号...中的每个点,都可以理解成占位符,表示任何类似的东西。
// 如果要匹配任意字符怎么办?可以使用[\d\D]、[\w\W]、[\s\S]和[^]中任何的一个。
// 贪婪匹配与惰性匹配
const regexTan = /\d{2,5}/g;
const stringTan = '123 1234 12345 123456';
console.log('贪婪匹配', stringTan.match(regexTan));
const regexDuo = /\d{2,5}?/g;
const stringDuo = '123 1234 12345 123456';
console.log('惰性匹配', stringDuo.match(regexDuo));
// 多选分支
const regexDuoxuan = /good|nice/g;
const stringDuoxuan = 'good idea, nice try.';
console.log('多选分支', stringDuoxuan.match(regexDuoxuan));
// 注意,用/good|goodbye/,去匹配"goodbye"字符串时,结果是"good"
const regexGood = /good|goodbye/g;
const stringRegexGood = 'goodbye';
console.log('分支结构也是惰性的', stringRegexGood.match(regexGood));
/**
* 案例分析
*/
// 匹配16进制颜色值,要求匹配:#ffbbad、#Fc01DF、#FFF、#ffE
const regex16 = /#([0-9a-fA-F]{6}|([0-9a-fA-F]{3}))/g;
const string16 = '#ffbbad #Fc01DF #FFF #ffE';
console.log('匹配16进制颜色值', string16.match(regex16));
// 匹配时间,以24小时为例,要求匹配:23:59 02:07 7:9
const regex24 = /^(0?[0-9]|1[0-9]|[2][0-3]):(0?[0-9]|[1-5][0-9])$/;
console.log('匹配时间', regex24.test('23:59'));
console.log('匹配时间', regex24.test('02:07'));
console.log('匹配时间', regex24.test('7:9'));
// ^ 和 $ 分别表示开头与结尾
// 匹配日期 格式为 yyyy-mm-dd
const regexDate = /^[0-9]{4}-(0[1-9]|1[0-2])-(0[1-9]|[12][0-9]|3[01])/;
console.log('匹配日期', regexDate.test('2017-06-10'));
// 匹配 window 操作系统文件路径
/**
* 要求匹配:
* F:\study\javascript\regex\regular expression.pdf
* F:\study\javascript\regex\
* F:\study\javascript
* F:\
*/
const regexWin = /^[a-zA-Z]:\\([^\\:*<>|"?\r\n/]+\\)*([^\\:*<>|"?\r\n/]+)?$/;
console.log('匹配winows文件路径', regexWin.test('F:\\studyjavascript\\regex\\regular expression.pdf'));
// 匹配id
/**
* 要求从 <div id="container" class="main"></div> 提取出 id="container"
*/
const regexDom = /id=".*?"/; // 可以优化成 /id="[^"]*"/
const stringDom = '<div id="container" class="main"></div>';
console.log('匹配id', stringDom.match(regexDom)[0]);