正则表达式笔记（一）：字符匹配--- highlight: atelier-savanna-light theme: c

/**
 * 字符匹配
 *
 * 模糊匹配：
 *  横向模糊匹配：一个正则可匹配的字符串的长度不是固定的，可以是多种情况的。其实现的方式是使用量词。譬如{m,n}，表示连续出现最少 m 次，最多 n 次。
 *  纵向模糊匹配: 一个正则匹配的字符串，具体到某一位字符时，它可以不是某个确定的字符，可以有多种可能。其实现的方式是使用字符组。譬如[abc]，表示该字符是可以字符"a"、"b"、"c"中的任何一个。
 *
 * 字符组：虽叫字符组（字符类），但只是其中一个字符。例如[abc]，表示匹配一个字符，它可以是"a"、"b"、"c"之一。
 *  范围表示法：[123456abcdefGHIJKLM] 可以简写成 [1-6a-fG-M]，使用了连字符"-"。
 *  排除字符组：某位字符可以是任何东西，但就不能是"a"、"b"、"c"，这里可以使用脱字符"^"，表示求反的概念。
 *
 * 量词：量词也称重复。掌握{m,n}的准确含义后，只需要记住一些简写形式。
 *  简写形式：
 *    {m,} 表示至少出现 m 次。
 *    {m} 等价于{m,m}，表示出现 m 次。
 *    ? 等价于{0,1}，表示出现或不出现。记忆方式：问号的意思表示，有吗？
 *    + 等价于{1,}，表示至少出现一次。记忆方式：加号是追加的意思，得先有一个，然后才考虑追加。
 *    * 等价于{0,}，表示出现任意次，有可能不出现。记忆方式：看看天上的星星，可能一颗没有，可能零散有几颗，可能数也数不过来。
 *  贪婪匹配与惰性匹配：
 *    贪婪，它会尽可能多的匹配，只要在能力范围内，越多越好。
 *    惰性，就是尽可能少的匹配，通过在量词后面加个问号就能实现惰性匹配。
 *
 *    惰性量词 {m,n}? {m,}? ?? +? *?
 *    贪婪量词 {m,n} {m,} ? + *
 *
 * 多选分支：多选分支可以支持多个子模式任选其一。具体形式如下：(p1|p2|p3)，其中p1、p2和p3是子模式，用|（管道符）分隔，表示其中任何之一。
 *  但有个事实我们应该注意，比如我用/good|goodbye/，去匹配"goodbye"字符串时，结果是"good"
 */

// 横向模糊匹配
const regexpHeng = /ab{2,4}c/g; // g 是正则的一个修饰符。表示全局匹配，即，在目标字符串中按顺序找到满足匹配模式的所有子串，强调的是“所有”，而不只是“第一个”。
const stringHeng = 'abc abbc abbbc abbbbc abbbbbc';
console.log('横向模糊匹配', stringHeng.match(regexpHeng));

// 纵向模糊匹配
const regexpZong = /a[234]b/g;
const stringZong = 'a1b a2b a3b a4b a5b';
console.log('纵向模糊匹配', stringZong.match(regexpZong));

// 范围表示法
// 需求：匹配 "a"、"-"、"c"中任意一字符
const az1 = /a\-z/;
const az2 = /-az/;
const az3 = /az-/;

// 排除字符组
// 常见的简写形式
const d = /\d/; // 表示[0-9]。表示是一位数字。记忆方式：其英文是 digit（数字）。
const D = /\D/; // 表示[^0-9]。表示除数字外的任意字符。
const w = /\w/; // 表示[0-9a-zA-Z_]。表示数字、大小写字母和下划线。记忆方式：w 是 word 的简写，也称单词字符。
const W = /\W/; // 表示[^0-9a-zA-Z_]。非单词字符。
const s = /\s/; // 表示[ \t\v\n\r\f]。表示空白符，包括空格、水平制表符、垂直制表符、换行符、回车符、换页符。记忆方式：s 是 space 的首字母，空白符的单词是 white space。
const S = /\S/; // 表示[^ \t\v\n\r\f]。非空白符。
const point = /./; // 表示[^\n\r\u2028\u2029]。通配符，表示几乎任意字符。换行符、回车符、行分隔符和段分隔符除外。记忆方式：想想省略号...中的每个点，都可以理解成占位符，表示任何类似的东西。

// 如果要匹配任意字符怎么办？可以使用[\d\D]、[\w\W]、[\s\S]和[^]中任何的一个。

// 贪婪匹配与惰性匹配
const regexTan = /\d{2,5}/g;
const stringTan = '123 1234 12345 123456';
console.log('贪婪匹配', stringTan.match(regexTan));

const regexDuo = /\d{2,5}?/g;
const stringDuo = '123 1234 12345 123456';
console.log('惰性匹配', stringDuo.match(regexDuo));

// 多选分支
const regexDuoxuan = /good|nice/g;
const stringDuoxuan = 'good idea, nice try.';
console.log('多选分支', stringDuoxuan.match(regexDuoxuan));

// 注意，用/good|goodbye/，去匹配"goodbye"字符串时，结果是"good"
const regexGood = /good|goodbye/g;
const stringRegexGood = 'goodbye';
console.log('分支结构也是惰性的', stringRegexGood.match(regexGood));

/**
 * 案例分析
 */

// 匹配16进制颜色值，要求匹配：#ffbbad、#Fc01DF、#FFF、#ffE
const regex16 = /#([0-9a-fA-F]{6}|([0-9a-fA-F]{3}))/g;
const string16 = '#ffbbad #Fc01DF #FFF #ffE';
console.log('匹配16进制颜色值', string16.match(regex16));

// 匹配时间，以24小时为例，要求匹配：23:59 02:07 7:9
const regex24 = /^(0?[0-9]|1[0-9]|[2][0-3]):(0?[0-9]|[1-5][0-9])$/;
console.log('匹配时间', regex24.test('23:59'));
console.log('匹配时间', regex24.test('02:07'));
console.log('匹配时间', regex24.test('7:9'));

// ^ 和 $ 分别表示开头与结尾

// 匹配日期 格式为 yyyy-mm-dd
const regexDate = /^[0-9]{4}-(0[1-9]|1[0-2])-(0[1-9]|[12][0-9]|3[01])/;
console.log('匹配日期', regexDate.test('2017-06-10'));

// 匹配 window 操作系统文件路径
/**
 * 要求匹配：
 *  F:\study\javascript\regex\regular expression.pdf
 *  F:\study\javascript\regex\
 *  F:\study\javascript
 *  F:\
 */

const regexWin = /^[a-zA-Z]:\\([^\\:*<>|"?\r\n/]+\\)*([^\\:*<>|"?\r\n/]+)?$/;
console.log('匹配winows文件路径', regexWin.test('F:\\studyjavascript\\regex\\regular expression.pdf'));

// 匹配id
/**
 * 要求从 <div id="container" class="main"></div> 提取出 id="container"
 */
const regexDom = /id=".*?"/; // 可以优化成 /id="[^"]*"/
const stringDom = '<div id="container" class="main"></div>';
console.log('匹配id', stringDom.match(regexDom)[0]);