js --- 正则表达式

133 阅读5分钟

正则表达式

  • 正则表达式,又名规则表达式
  • 我自己书写的“规则”,专门来检测"字符串"是否复合规则使用的
    • 我们使用一些特殊的字符或者符号定义一个 "规则公式", 然后用我们定义好的 "规则公式" 去检测字符串是不是合格
var reg = /\d+/
var str1 = '123'
var str2 = 'abc'
console.log(reg.test(str1)) // true
console.log(reg.test(str2)) // false
  • 上面的变量reg就是我们自己制定的规则
  • 检测str1这个字符串的时候符合规则,检测str2不符合

创建正则表达式

  • 字面量创建
    • const reg = /abcdefg/
  • 构造函数创建
    • const reg = new RegExp('abcdefg')
  • 其中 // 和 '' 之间的内容就是正则表达式

正则内的符号

元字符

  • .: 匹配非换行的任意字符
  • \: 转译符号, 把有意义的 符号 转换成没有意义的 字符, 把没有意义的 字符 转换成有意义的 符号
  • \s: 匹配空白字符(空格/制表符/...)
  • \S: 匹配非空白字符
  • \d: 匹配数字
  • \D: 匹配非数字
  • \w: 匹配数字字母下划线
  • \W: 匹配非数字字母下划线

限定符

  • * : 前一个内容重复至少 0 次, 也就是可以出现 0~正无穷
  • + : 前一个内容重复至少 1 次, 也就是可以出现 1~正无穷
  • ? : 前一个内容重复 0 或者 1 次, 也就是可以出现 0~1
  • {n} : 前一个内容重复 n 次, 也就是必须出现 n
  • {n,} : 前一个内容至少出现 n 次, 也就是出现 n ~ 正无穷
  • {n,m} : 前一个内容至少出现 n 次至多出现 m 次, 也就是出现 n~m

边界符

  • ^: 表示开头
  • $: 表示结尾
var reg = /^\d{3,5}$/
var str = 'abc'
var str2 = 'abc123'
var str3 = '1'
var str4 = '1234567'
var str5 = '123'
var str6 = '12345'
console.log(reg.test(str))  // false
console.log(reg.test(str2))  // false
console.log(reg.test(str3))  // false
console.log(reg.test(str4))  // false
console.log(reg.test(str5))  // true
console.log(reg.test(str6))  // true

特殊符号

  • (): 限定一组元素,将()内的内容视为一个整体
  • []: 字符集合, 表示写在 [] 里面的任意一个都行
  • [^]: 反字符集合, 表示写在 [^] 里面之外的任意一个都行
  • -: 范围, 比如 a-z 表示从字母 a 到字母 z 都可以
  • |: 或, 正则里卖弄的或 a|b 表示字母 a 或者 b 都可以
/**
 * 书写一个简单的邮箱验证
 * 
 *  验证规则:
 *      非 _$开头, 任意字符出现至少6次, 一个@符号, (163|126|qq|sina)中的任意一个, 一个点, (com|cn|net) 中的任意一个
*/
var reg = /^[^_$].{5,}@(163|126|qq)\.(com|cn|net)$/

标识符

  • i : 表示忽略大小写
    • 这个 i 是写在正则的最后面的, 例如: /\w/i
    • 这就是在匹配的时候匹配数字字母下划线, 并且不区分大小写
  • g : 表示全局匹配
    • 这个 g 是写在正则的最后面的, 例如: /\w/g
    • 就是全局匹配数字字母下划线

正则的特性

  • 每次捕获都会从字符串 [0] 的位置开始检索
    • 解决:给正则添加g,全局标识符
  • 每次捕获内容的时候会尽可能地多的去捕获内容(贪婪)
    • 解决:使用非贪婪限定符(在原有限定符后面多加一个 ?)
    • 贪婪限定符:*; +; ?; {n,}; {n,m}
    • 非贪婪限定符:*?; +?; ??; {n,}?; {n,m}?

正则表达式的方法

test 用来检测字符串是否符合我们正则的标准

  • 语法:正则.test('字符串')
  • 返回值: boolean

console.log(/\d+/.test('123'))

exec 把字符串中符合条件的内容捕获出来

  • 语法: 正则.exec(字符串)

  • 返回值:

    1. 当原始字符串内没有符合正则规范的片段的时候, 返回值为 null

    2. 当原始字符串内有符合正则规范的判断的时候

      • 返回值一定是一个数组: 数组内的 [0] 是捕获出来的字符串片段

      • 没有 () 没有标识符g

        • 只能获取第一组匹配到的字符串片段
        • 不管匹配多少回, 都是从字符串 [0] 的位置开始检索
      • 有 () 会在返回值数组的 [1] 开始依次是每一个 () 内的单独内容

      • 有 g

        • g 叫做全局标识符
        • 第二次捕获会从第一次捕获的结束位置开始进行检索
        • 直到找不到内容, 返回 null
        • 在下一次捕获的时候, 会从字符串 [0] 开始检索

正则的字符串方法

  • search: 查找字符串中是否有满足条件的内容
    • 语法: 字符串.search(正则)
    • 返回值: 有的话返回开始索引, 没有返回 -1
var reg = /\d{3}/
var str1 = 'hello123'
var str2 = 'hello'
console.log(str1.search(reg))   // 5
console.log(str2.search(reg))   // -1
  • match: 找到字符串中符合正则条件的内容返回
    • 语法: 字符串.match(正则)

    • 返回值:

      • 没有标识符 g 的时候, 是和 exec 方法一样
      • 有标识符 g 的时候, 是返回一个数组, 里面是匹配到的每一项, 没有匹配到内容是返回的是 null
var reg = /\d{3}/
var str1 = 'hello123world456'
var str2 = 'hello world'
console.log(str1.match(reg))
// 打印结果
/*
['123', index: 5, input: 'hello123world456', groups: undefined]
    0: "123"
    groups: undefined
    index: 5
    input: "hello123world456"
    length: 1
*/
console.log(str2.match(reg))    // -1


var reg = /\d{3}/g
var str1 = 'hello123world456'
var str2 = 'hello world'
console.log(str1.match(reg))    // ['123', '456']
console.log(str2.match(reg))    // null
  • replace: 是将字符串中满足正则条件的字符串替换掉
    • 语法: 字符串.replace(正则, 要替换的字符串)
    • 返回值: 替换后的字符串
var reg = /\d{3}/
var str1 = 'hello123world456'
var str2 = 'hello world'
console.log(str1.replace(reg, '哈哈哈哈'))    // hello哈哈哈哈world456
console.log(str2.replace(reg, '哈哈哈哈'))    // hello world


var reg = /\d{3}/g
var str1 = 'hello123world456'
var str2 = 'hello world'
console.log(str1.replace(reg, '哈哈哈哈'))    // hello哈哈哈哈world哈哈哈哈
console.log(str2.replace(reg, '哈哈哈哈'))    // hello world