这是我参与「第四届青训营 」笔记创作活动的的第13天
1.正则表达式概述
1.1什么是正则表达式
正则表达式( Regular Expression )是用于匹配字符串中字符组合的模式。在JavaScript中,正则表达式也是对象。
正则表通常被用来检索、替换那些符合某个模式(规则)的文本,例如验证表单:用户名表单只能输入英文字母、数字或者下划线, 昵称输入框中可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等 。
其他语言也会使用正则表达式,本阶段我们主要是利用JavaScript 正则表达式完成表单验证。
1.2 正则表达式的特点
- 灵活性、逻辑性和功能性非常的强。
- 可以迅速地用极简单的方式达到字符串的复杂控制。
- 对于刚接触的人来说,比较晦涩难懂。比如:^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
- 实际开发,一般都是直接复制写好的正则表达式. 但是要求会使用正则表达式并且根据实际情况修改正则表达式. 比如用户名: /^[a-z0-9_-]{3,16}$/
2.正则表达式在js中的使用
2.1正则表达式的创建
在 JavaScript 中,可以通过两种方式创建一个正则表达式。
方式一:通过调用 RegExp 对象的构造函数创建 【一定要有正斜杠】
var regexp = new RegExp(/123/);
console.log(regexp);
方式二:利用字面量创建 正则表达式【一定要有正斜杠】
var rg = /123/;
▲2.2 .test()判断正则表达式
.test() 正则对象方法,用于检测字符串是否符合该规则,该对象会返回 true 或 false,其参数是测试字符串。
var rg = /123/;
console.log(rg.test(123));//匹配字符中是否出现123 出现结果为true
console.log(rg.test('abc'));//匹配字符中是否出现123 未出现结果为false
▲3.正则表达式中的特殊字符
3.1正则表达式的组成
一个正则表达式可以由简单的字符构成,比如 /abc/,也可以是简单和特殊字符的组合,比如 /ab*c/ 。其中特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符号,如 ^ 、$ 、+ 、*等。
特殊字符非常多,可以参考:
jQuery 手册:正则表达式部分
[正则测试工具]( <tool.oschina.net/regex)
3.2边界符 ^ $
正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符
| 边界符 | 说明 |
|---|---|
| ^ | 表示匹配行首的文本(以谁开始) |
| $ | 表示匹配行尾的文本(以谁结束) |
| ^...$ | 必须是...,如果使用了^[xyz]$,那就是x或y或z (单个字符多种情况) |
如果 ^和 $ 在一起,表示必须是完全一致。
var rg = /abc/; // 正则表达式里面不需要加引号 不管是数字型还是字符串型
/abc/ 只要包含有abc这个字符串返回的都是true:
console.log(rg.test('abc')); // true
console.log(rg.test('abcd')); // true
console.log(rg.test('aabcd')); // true
console.log('---------------------------');
var reg = /^abc/;
console.log(reg.test('abc')); // true
console.log(reg.test('abcd')); // true
console.log(reg.test('aabcd')); // false
console.log('---------------------------');
var reg1 = /^abc$/; // 精确匹配 要求必须是 abc字符串才符合规范
console.log(reg1.test('abc')); // true
console.log(reg1.test('abcd')); // false
console.log(reg1.test('aabcd')); // false
console.log(reg1.test('abcabc')); // false
▲3.3字符类
字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。
3.3.1 [] 方括号(或)
表示有一系列字符可供选择,只要匹配其中一个就可以了(或运算)
- 方括号内部加上 ^ 表示取反,表示【不能】包含方括号内的字符。
var reg2 = /[a-zA-Z]/表示:从 a-z 以及 A-Z(中括号内的与运算就是直接加)var reg2 = /^[a-zA-Z0-9_-]$/因为短斜杠本身有 xx到xx 的意思,所以只要短斜杠前后都有字符,就会当做 xx到xx ;所以【[b-a]或者[a-1]都会报错】- 所以如果想包含短斜杠,要放中括号的最后
var rg = /[abc]/; // 只要包含 a或b或c 都返回为true
console.log(rg.test('andy'));//true
console.log(rg.test('baby'));//true
console.log(rg.test('color'));//true
console.log(rg.test('red'));//false
----------------------------------------------------------------------------------
// 只能有一个字母,要么a要么b要么c;才返回 true
// 你可以理解为,逻辑运算符(与或非)优先级靠后,所以才导致这种情况
var rg1 = /^[abc]$/;
console.log(rg1.test('aa'));//false
console.log(rg1.test('a'));//true
console.log(rg1.test('b'));//true
console.log(rg1.test('c'));//true
console.log(rg1.test('abc'));//false
----------------------------------------------------------------------------------
var reg = /^[a-z]$/ //26个英文字母任何一个字母返回 true - 表示的是a 到z 的范围
console.log(reg.test('a'));//true
console.log(reg.test('z'));//true
console.log(reg.test('A'));//false
-----------------------------------------------------------------------------------
//字符组合
var reg1 = /^[a-zA-Z0-9]$/; // 26个英文字母(大写和小写都可以)任何一个字母返回 true
------------------------------------------------------------------------------------
//【方括号内部加上 ^】表示取反,表示【不能】包含方括号内的字符。
var reg2 = /^[^a-zA-Z0-9]$/;
console.log(reg2.test('a'));//false
console.log(reg2.test('B'));//false
console.log(reg2.test(8));//false
console.log(reg2.test('!'));//true
3.3.2 量词符{}
量词符用来设定某个模式出现的次数。
-
{n,m} 里面n最小为0
-
n不能为空【 { ,m}是不存在的 】
-
{n,m}不能有空格【{n, m} 是不行的】
| 量词 | 说明 |
|---|---|
| * | 重复0次或更多次 ≥0 |
| + | 重复1次或更多次 ≥1 |
| ? | 重复0次或1次 |
| {n} | 重复n次 |
| {n,} | 重复n次或更多次 ≥n |
| {n,m} | 重复n到m次 m≥x≥n |
// 6. {3, 16} 大于等于3 并且 小于等于16
var reg = /^a{0,5}$/;
console.log(reg.test(''));
console.log(reg.test('a'));
console.log(reg.test('aa'));
console.log(reg.test('aaaaaa'));
console.log(reg.test('aaa'));
console.log(reg.test('aaaaaaaaaaaaaaaaaaaaa'));
3.3.3 案例:用户名表单验证
功能需求:
- 如果用户名输入合法, 则后面提示信息为: 用户名合法,并且颜色为绿色
- 如果用户名输入不合法, 则后面提示信息为: 用户名不符合规范, 并且颜色为红色
分析:
- 用户名只能为英文字母,数字,下划线或者短横线组成, 并且用户名长度为6~16位.
- 首先准备好这种正则表达式模式/^[a-zA-Z0-9-_]{6,16}$/
- 当表单失去焦点就开始验证.
- 如果符合正则规范, 则让后面的span标签添加 right类.
- 如果不符合正则规范, 则让后面的span标签添加 wrong类.
<input type="text" class="uname"> <span>请输入用户名</span>
<script>
// 量词是设定某个模式出现的次数
var reg = /^[a-zA-Z0-9_-]{6,16}$/; // 这个模式用户只能输入英文字母 数字 下划线 中划线
var uname = document.querySelector('.uname');
var span = document.querySelector('span');
uname.onblur = function() {
if (reg.test(this.value)) {
console.log('正确的');
span.className = 'right';
span.innerHTML = '用户名格式输入正确';
} else {
console.log('错误的');
span.className = 'wrong';
span.innerHTML = '用户名格式输入不正确';
}
}
</script>
3.3.4 括号总结
1.大括号{} 量词符 里面表示重复次数
2.中括号[] 字符集合 匹配方括号中的任意字符
3.小括号() 表示优先级
var reg = /^abc{3}$/; // 它只让c重复三次:abccc
console.log(reg.test('abc')); //false
console.log(reg.test('abcabcabc')); //false
console.log(reg.test('abccc')); //true
// 小括号 表示优先级
var reg = /^(abc){3}$/; // 加上小括号才能让abc重复三次
console.log(reg.test('abc')); //false
console.log(reg.test('abcabcabc')); //true
console.log(reg.test('abccc')); //false
▲3.4 预定义类\
预定义类指的是某些常见模式的简写方式
- 这些都是反斜杠 \
| 预定义类 | 说明 |
|---|---|
| . | (小数点)匹配除换行符\n之外的任何单个字符 |
| \d | 匹配0-9之间的任一数字,相当于[0-9] |
| \D | 匹配所有0-9以外的字符,相当于[^0-9] |
| \w | 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_] |
| \W | 除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_] |
| \s | 匹配空格(包括换行符、制表符、空格符等)相等于[ \t\r\n\v\f] |
| \S | 匹配非空格的字符,相当于[^ \t\r\n\v\f] |
3.4.1 案例:验证座机号码
// 座机号码验证: 全国座机号码 两种格式: 010-12345678 或者 0530-1234567
// “|”代表“或”的意思
var reg = /^\d{3}-\d{8}|\d{4}-\d{7}$/;
var reg = /^\d{3,4}-\d{7,8}$/; // 这样会出现3-7 和4-8 的情况,不严谨
3.4.2 表单<input>验证案例
手机号验证:
//手机号验证:/^1[3|4|5|7|8]\d{9}$/;
//验证通过与不通过更换元素的类名与元素中的内容
if (reg.test(this.value)) {
// console.log('正确的');
this.nextElementSibling.className = 'success';
this.nextElementSibling.innerHTML = '<i class="success_icon"></i> 恭喜您输入正确';
} else {
// console.log('不正确');
this.nextElementSibling.className = 'error';
this.nextElementSibling.innerHTML = '<i class="error_icon"></i>格式不正确,请从新输入 ';
}
QQ号、昵称验证:
//QQ号验证: /^[1-9]\d{4,}$/;
//昵称验证:/^[\u4e00-\u9fa5]{2,8}$/ \u4e00-\u9fa5表示第一个到最后一个汉字
//验证通过与不通过更换元素的类名与元素中的内容 ,将上一步的匹配代码进行封装,多次调用即可
function regexp(ele, reg) {
ele.onblur = function() {
if (reg.test(this.value)) {
// console.log('正确的');
this.nextElementSibling.className = 'success';
this.nextElementSibling.innerHTML = '<i class="success_icon"></i> 恭喜您输入正确';
} else {
// console.log('不正确');
this.nextElementSibling.className = 'error';
this.nextElementSibling.innerHTML = '<i class="error_icon"></i> 格式不正确,请从新输入 ';
}
}
};
密码验证:
//密码验证:/^[a-zA-Z0-9_-]{6,16}$/
//再次输入密码只需匹配与上次输入的密码值 是否一致
window.onload = function() {
var regtel = /^1[3|4|5|7|8]\d{9}$/; // 手机号码的正则表达式
var regqq = /^[1-9]\d{4,}$/; // 10000
var regnc = /^[\u4e00-\u9fa5]{2,8}$/;
var regmsg = /^\d{6}$/;
var regpwd = /^[a-zA-Z0-9_-]{6,16}$/;
var tel = document.querySelector('#tel');
var qq = document.querySelector('#qq');
var nc = document.querySelector('#nc');
var msg = document.querySelector('#msg');
var pwd = document.querySelector('#pwd');
var surepwd = document.querySelector('#surepwd');
regexp(tel, regtel); // 手机号码
regexp(qq, regqq); // qq号码
regexp(nc, regnc); // 昵称
regexp(msg, regmsg); // 短信验证
regexp(pwd, regpwd); // 密码框
// 表单验证的函数
function regexp(ele, reg) {
ele.onblur = function() {
if (reg.test(this.value)) {
// console.log('正确的');
this.nextElementSibling.className = 'success';
this.nextElementSibling.innerHTML = '<i class="success_icon"></i> 恭喜您输入正确';
} else {
// console.log('不正确');
this.nextElementSibling.className = 'error';
this.nextElementSibling.innerHTML = '<i class="error_icon"></i> 格式不正确,请从新输入 ';
}
}
};
surepwd.onblur = function() {
if (this.value == pwd.value) {
this.nextElementSibling.className = 'success';
this.nextElementSibling.innerHTML = '<i class="success_icon"></i> 恭喜您输入正确';
} else {
this.nextElementSibling.className = 'error';
this.nextElementSibling.innerHTML = '<i class="error_icon"></i> 两次密码输入不一致';
}
}
}
▲4. 正则替换replace
str.replace(regexp|substr, newSubStr|function)
- str为被修改的字符串
- 第一个参数为需要修改的部分(可以是一个字符串或是一个正则表达式)
- 第二个参数是替换第一个参数的内容
- 该方法并不改变调用它的字符串本身,而只是返回一个新的替换后的字符串。
/表达式/[switch]
switch(也称为修饰符) 按照什么样的模式来匹配. 有三种值:
- g: 全局匹配 (如果正则表达式最后不加g ,则只会替换一次!所以当字符串里有多处需要被替换,记得加g)
- i: 忽略大小写
- gi: 全局匹配 + 忽略大小写
var str = 'andy和red';
var newStr = str.replace('andy', 'baby');
console.log(newStr)//baby和red
//等同于 此处的andy可以写在正则表达式内
var newStr2 = str.replace(/andy/, 'baby');
console.log(newStr2)//baby和red
//不加g
var str = 'abcabc'
var nStr = str.replace(/a/,'哈哈') // "哈哈bcabc"
//全部替换g
var str = 'abcabc'
var nStr = str.replace(/a/g,'哈哈') // "哈哈bc哈哈bc"
//忽略大小写i
var str = 'aAbcAba';
var newStr = str.replace(/a/gi,'哈哈') // "哈哈哈哈bc哈哈b哈哈"
案例:过滤敏感词汇
<textarea name="" id="message"></textarea> <button>提交</button>
<div></div>
<script>
var text = document.querySelector('textarea');
var btn = document.querySelector('button');
var div = document.querySelector('div');
btn.onclick = function() {
div.innerHTML = text.value.replace(/激情|gay/g, '**');
}
</script>