Js正则表达式

557 阅读4分钟

目标

  • 能够说出正则表达式的作用
  • 能够写出简单的正则表达式
  • 能够使用正则表达式对表单进行验证
  • 能够使用正则表达式替换内容

目录

  • 正则表达式概述
  • 正则表达式在JavaScript中的使用
  • 正则表达式中的特殊字符
  • 正则表达式中的替换

1. 正则表达式概述

1.1 什么是正则表达式

正则表达式(Regular Expreesion) 是用于匹配字符串中字符组合的模式。在JavaScript中,正则表达式也是对象。

正则表通常呗用来检索、替换那些符合某模式(规则)的文本,例如验证表单:用户名表单只能输入鹦鹉字母、数字或者下划线,昵称输入框中可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等。

其他语言也会使用正则表达式,本阶段我们主要是利用JavaScript正则表达式完成表单验证。

1.2 正则表达式的特点

  1. 灵活性、逻辑性和功能性非常的强
  2. 可以迅速地用极简单的方式达到字符串的复杂控制。
  3. 对应刚接触的人来说,比较晦涩难懂。比如:^\w+([-+]。\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
  4. 实际开发,一般都是直接复制写好的正则表达式。但是要求会使用正则表达式并且根据实际情况修改正则表达式。比如用户名: /^[a-z0-9_-]{3,16}$/

2. 正则表达式在JavaScript中的使用

2.1 创建正则表达式

在JavaScript中,可以通过两种方式创建一个正则表达式。

1. 通过调用RegExp对象的构造函数创建

var 变量名 = new RegExp"表达式");

2. 通过字面量创建

var 变量名 = /表达式/;

2.2 测试正则表达式test

test()正则对象方法,用于检测字符串是否符合该规则,该对象会返回true或false,其参数是测试字符串。

regexobj.test(str)
  1. regexobj 是写的正则表达式
  2. str 是我们要测试的文本
  3. 就是检测str文本是否符合我们写的正则表达式规范

3. 正则表达式中的特殊字符

3.1 正则表达式的组成

一个正则表达式可以由简单的字符构成,比如/abc/,也可以是简单的特殊字符的组合,比如/ab*c/。其中特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符合,如^、$、+等。

特殊字符非常多,可以参考:

这里把元字符划分几类学习。

3.2 边界符

正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符。

  • ^ : 表示匹配行首的文本(以谁开始)
  • $ : 表示匹配行尾的文本(以谁结束)

如果^和$在一起,表示必须是精确匹配。

3.3 字符类

字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。

1. 方括号[]

[] 表示有一系列字符可供选择,只要匹配其中一个就可以了

 var rg = /[abc]/; // 只要包含有a 或者 包含有b 或者包含有c 都返回为true

2. [-] 方括号内部范围符-

a-z 表示的是a到z的范围

var reg = /^[a-z]$/; // 26个英文字母任何一个字母返回 true 

3. 字符组合

/^[a-z0-9]$/.test('a') // true

4. [^] 方括号内部 取反符^

/^[^abc]$/.test('a') //false

3.4 量词符

量词符用来设定某个模式出现的次数

  • * :重复零次或更多次
    • :重复一次或更多次
  • ? :重复零次或一次
  • {n}:重复n次
  • {n,}:重复n次或更多次
  • {n,m}:重复n到m次

案例:用户名验证

功能需求:

  1. 如果用户名输入合法,则后面提升信息为:用户名合法,并且颜色为绿色
  2. 如果用户名输入不合法,则后面提示信息为:用户名不符合规范,并且颜色为红色

分析:

  1. 用户名只能为英文字母、数字、下划线或者短横线组成,并且用户名长度为6~16位
  2. 首先准备好这种正则表达式模式/$[a-zA-Z0-9-_]{6,16}^/
  3. 当表单失去焦点就开始验证
  4. 如果符合正则规范,则让后面的span标签添加right类
  5. 如果不符合规范,则让后面的span标签添加wrong类
<input type="text" class="uname"> <span class="message">请输入用户名</span>
  <script>
    // 量词是设定某个模式出现的次数
    var reg = /^[a-zA-Z0-9_-]{6,16}$/; // 这个模式用户只能输入英文字母 数字 下划线 短横线但是有边界符和[] 这就限定了只能多选1

    var uname = document.querySelector('.uname');
    var msg = document.querySelector('.message');
    uname.onblur = function() {
      if(reg.test(this.value)) {
        msg.innerHTML = '用户名合法';
        msg.classList.remove('wrong');
        msg.classList.add('right');
      } else {
        msg.innerHTML = '用户名不合法';
        msg.classList.remove('right');
        msg.classList.add('wrong');
      }
    }
  </script>

3.5 括号总结

  1. 大括号 量词符。里面表示重复次数
  2. 中括号 字符集合。匹配方括号中的任意字符。
  3. 小括号 表示优先级

可以在线测试:c.runoob.com/front-end/8…

3.6 预定义类

预定义类指的是某些常见模式的简写方式。

  • \d:匹配0-9之间的任一数字,相当于[0-9]
  • \D:匹配所有0-9以外的字符,相当于[^0-9]
  • \w:匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_]
  • \W:除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_]
  • \s:匹配空格(包括换行符、制表符、空格符等),相等于[\t\r\n\v\f]
  • \S:匹配非空格的字符,相当于[^\t\r\n\v\f]

4. 正则表达式中的替换

4.1 replace替换

replace()方法可以实现字符串操作,用来替换的参数可以是一个字符串或是一个正则表达式。

stringObject.replace(regxp/substr,replacement)
  1. 第一个参数:被替换的字符串 或者 正则表达式
  2. 第二个参数:替换为的字符串
  3. 返回值是一个替换完毕的新字符串
/表达式/[switch]

switch(也称为修饰符)按照什么样的模式来匹配,有三种值:

  • g:全局匹配
  • i:忽略大小写
  • gi:全局匹配 + 忽略大小写