正则表达式

148 阅读4分钟

一、正则表达式概述

1.1 什么是正则表达式

正则表达式( Regular Expression )是用于匹配字符串中字符组合的模式。在 JavaScript中,正则表达式也是对象。

正则表通常被用来检索、替换那些符合某个模式(规则)的文本,例如验证表单:用户名表单只能输入英文字母、数字或者下划线, 昵称输入框中可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等 。

其他语言也会使用正则表达式,本阶段我们主要是利用 JavaScript 正则表达式完成表单验证。

1.2 正则表达式的特点
  1. 灵活性、逻辑性和功能性非常的强。

  2. 可以迅速地用极简单的方式达到字符串的复杂控制。

  3. 对于刚接触的人来说,比较晦涩难懂。比如: ^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$

  4. 实际开发,一般都是直接复制写好的正则表达式. 但是要求会使用正则表达式并且根据实际情况修改正则表达式. 比如用户名: /^[a-z0-9_-]{3,16}$/

二、正则表达式在 JavaScript 中的使用

2.1 创建正则表达式

在 JavaScript 中,可以通过两种方式创建一个正则表达式。

  1. 通过调用 RegExp 对象的构造函数创建
   var 变量名 = new RegExp(/表达式/); 
  1. 通过字面量创建
   var 变量名 = /表达式/; 

// 注释中间放表达式就是正则字面量

2.2 测试正则表达式 test

test() 正则对象方法,用于检测字符串是否符合该规则,该对象会返回 true 或 false,其参数是测试字符串。

   regexObj.test(str) 

1、regexObj 是写的正则表达式

2、str 我们要测试的文本

3、就是检测str文本是否符合我们写的正则表达式规范.

示例:

        // 正则表达式在js中使用

        //1、利用RegExp对象来创建 正则表达式
        var regexp=new RegExp(/123/);
        // console.log(regexp);
        console.log(regexp.test('123'));
        // 2、利用字面量创建 正则表达式
        var rg= /123/;
        // 2、test方法用来检测字符串是否符合正则表达式要求的规范
        console.log(rg.test(123));

三、正则表达式中的特殊字符

3.1 正则表达式的组成

一个正则表达式可以由简单的字符构成,比如 /abc/,也可以是简单和特殊字符的组合,比如 /ab*c/ 。其中特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符号,如 ^ 、$ 、+ 等。

特殊字符非常多,可以参考:

MDN:developer.mozilla.org/zh-CN/docs/…

jQuery 手册:正则表达式部分

正则测试工具: tool.oschina.net/regex

3.2 边界符

正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符。

图片32.png

如果 ^ 和 $ 在一起,表示必须是精确匹配。

示例:

 // 边界符 ^ $
        // 正则表达式里面不需要加引号 不管是数字型还是字符型
        var rg=/abc/;
        // /abc/只要包含有abc这个字符串返回的都是true
        console.log(rg.test('abc')); //true
        console.log(rg.test('abcd')); //true
        console.log(rg.test('aabcd')); //true
        console.log('--------------'); 

        var reg=/^abc/;
        // 必须以abc开头
        console.log(reg.test('abc')); //true
        console.log(reg.test('abcd')); //true
        console.log(reg.test('aabcd')); //false

        console.log('--------------'); 

        var reg=/^abc$/;
        // 精确匹配 要求必须是abc字符串才符合规范
        console.log(reg.test('abc')); //true
        console.log(reg.test('abcd')); //false
        console.log(reg.test('aabcd')); //false
        console.log(reg.test('abcabc')); //false
3.3 字符类

字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。

  1. [] 方括号
   /[abc]/.test('andy')     // true 

后面的字符串只要包含 abc 中任意一个字符,都返回 true 。

  1. [-] 方括号内部 范围符-
   /^[a-z]$/.test(c)     // true

方括号内部加上 - 表示范围,这里表示 a 到 z 26个英文字母都可以。

  1. [^] 方括号内部 取反符^
   /[^abc]/.test('andy')     // false

方括号内部加上 ^ 表示取反,只要包含方括号内的字符,都返回 false 。

注意和边界符 ^ 区别,边界符写到方括号外面。

  1. 字符组合
   /[a-z1-9]/.test('andy')     // true

方括号内部可以使用字符组合,这里表示包含 a 到 z 的26个英文字母和 1 到 9 的数字都可以。

示例:

// 字符类:[] 表示有一系列可供选择 只要匹配其中一个就可以
        var rg=/[abc]/; //只要包含有a 或者 包含有b 或者包含有c 都返回true
        console.log(rg.test('ange')); //true 
        console.log(rg.test('yfxc')); //true
        console.log(rg.test('gsbd')); //true
        console.log(rg.test('hjty')); //true
        console.log('------------------');

        var reg=/^[abc]$/;
        // 三选一 只有是a 或者b 或者是c 这三个字母才返回 true
        console.log(reg.test('a')); //true
        console.log(reg.test('b')); //true
        console.log(reg.test('c')); //true
        console.log(reg.test('abc')); //false
        console.log('------------------');

        var reg1=/^[a-z]$/;
        //26个小写英文字母任何一个 返回 true
        console.log(reg1.test('a')); //true
        console.log(reg1.test('z')); //true
        console.log(reg1.test('1')); //false
        console.log(reg1.test('S')); //false
        console.log('------------------');
        
        var reg2=/^[a-zA-Z0-9_-]$/;
        //26个英文大小写字母,数字,-,_任何一个 返回 true
        console.log(reg2.test('a')); //true
        console.log(reg2.test('5')); //true
        console.log(reg2.test('S')); //true
        console.log(reg2.test('_')); //true
        console.log(reg2.test('-')); //true
        console.log(reg2.test('?')); //true
        console.log('------------------');

        var reg3=/^[^a-zA-Z0-9_-]$/;
        // 如果中括号中有^ 表示取反的意思 不能包含^后面的内容
        // 不要和边界符^混淆了
        console.log(reg3.test('a')); //false
        console.log(reg3.test('5')); //false
        console.log(reg3.test('S')); //false
        console.log(reg3.test('_')); //false
        console.log(reg3.test('-')); //false
        console.log(reg3.test('?')); //true
3.4 量词符

量词符用来设定某个模式出现的次数。

图片33.png

示例:

// 量词符:用来设定某个模式出现的次数
        // 简单理解:就是让下面的a这个字符重复多少次
        var reg=/^a$/;

        // * 相当于 >=0 可以出现0次或者很多次 添加到字符后面
        var reg1=/^a*$/; 
        console.log(reg1.test('')); //true
        console.log(reg1.test('a')); //true
        console.log(reg1.test('aaaaa')); //true

        // + 相当于>=1 可以出现1次或者很多次
        var reg2=/^a+$/; 
        console.log(reg2.test('')); //false
        console.log(reg2.test('a')); //true
        console.log(reg2.test('aaaaa')); //true

        // ? 相当于 1||0
        var reg2=/^a?$/; 
        console.log(reg2.test('')); //true
        console.log(reg2.test('a')); //true
        console.log(reg2.test('aaaaa')); //false

        // {3} 重复3次
        var reg3=/^a{3}$/; 
        console.log(reg3.test('')); //false
        console.log(reg3.test('a')); //false
        console.log(reg3.test('aaa')); //true
        console.log(reg3.test('aaaaa')); //false

        // {3,} 大于等于3
        var reg4=/^a{3,}$/; 
        console.log(reg4.test('')); //false
        console.log(reg4.test('a')); //false
        console.log(reg4.test('aaa')); //true
        console.log(reg4.test('aaaaa')); //true

        // {3,8} 大于等于3 并且小于等于8
        var reg5=/^a{3,8}$/; 
        console.log(reg5.test('')); //false
        console.log(reg5.test('a')); //false
        console.log(reg5.test('aaa')); //true
        console.log(reg5.test('aaaaaaaa')); //true
        console.log(reg5.test('aaaaaaaaa')); //false
3.5 括号总结

1、大括号 量词符. 里面表示重复次数

2、中括号 字符集合。匹配方括号中的任意字符.

3、小括号 表示优先级

可以在线测试: c.runoob.com/

示例:

        // 中括号 字符集合 匹配方括号中的任意字符
        var reg=/^[abc]$/;
        // a || b || c


        // 大括号 量词符 表示重复次数
        var reg= /^abc{3}$/;
        // 只是让c重复三次
        console.log(reg.test('abc')); //false
        console.log(reg.test('abccc')); //true
        console.log(reg.test('abcabcabc')); //false


        // 小括号 表示优先级
        var reg= /^(abc){3}$/;
        // 让abc重复三次
        console.log(reg.test('abc')); //false
        console.log(reg.test('abccc')); //false
        console.log(reg.test('abcabcabc')); //true
3.6 预定义类

预定义类指的是某些常见模式的简写方式。

图片34.png

四、正则表达式中的替换

4.1 replace 替换

replace() 方法可以实现替换字符串操作,用来替换的参数可以是一个字符串或是一个正则表达式。

stringObject.replace(regexp/substr,replacement)

1、第一个参数: 被替换的字符串 或者 正则表达式

2、第二个参数: 替换为的字符串

3、返回值是一个替换完毕的新字符串

4.2 正则表达式参数
   /表达式/[switch]

switch(也称为修饰符) 按照什么样的模式来匹配. 有三种值:

  • g:全局匹配
  • i:忽略大小写
  • gi:全局匹配 + 忽略大小写

注意:如果不加修饰符g,则只替换第一个

参考资料:

1、2019全新javaScript进阶面向对象ES6_哔哩哔哩_bilibili

2、菜鸟教程 (runoob.com)

3、MDN Web Docs (mozilla.org)