正则[学习笔记三]

262 阅读2分钟

字符方法

下面介绍的方法是 String 提供的支持正则表达式的方法

search

search() 方法用于检索字符串中指定的子字符串,也可以使用正则表达式搜索,返回值为索引位置

let str = "baidu.com";
console.log(str.search("com"));

使用正则表达式搜索

console.log(str.search(/\.com/i));

match

直接使用字符串搜索

let str = "baidu.com";
console.log(str.match("com"));

使用正则获取内容,下面是简单的搜索字符串

let lzx = "zhangsan";
let res = hd.match(/a/);
console.log(res);
console.log(res[0]); //匹配的结果
console.log(res[index]); //出现的位置

如果使用 g 修饰符时,就不会有结果的详细信息了(可以使用exec),下面是获取所有h1~6的标题元素

let body = document.body.innerHTML;
let result = body.match(/<(h[1-6])>[\s\S]+?<\/\1>/g);
console.table(result);

matchAll

在新浏览器中支持使用 matchAll 操作,并返回迭代对象

let str = "zhangsan";
let reg = /[a-z]/ig;
for (const iterator of str.matchAll(reg)) {
  console.log(iterator);
}

split

用于使用字符串或正则表达式分隔字符串,下面是使用字符串分隔日期

let str = "2023-02-12";
console.log(str.split("-")); //["2023", "02", "12"]

如果日期的连接符不确定,那就要使用正则操作了

let str = "2023/02-12";
console.log(str.split(/-|\//));

replace

replace 方法不仅可以执行基本字符替换,也可以进行正则替换,下面替换日期连接符

let str = "2023/02/12";
console.log(str.replace(/\//g, "-")); //2023-02-12

替换字符串可以插入下面的特殊变量名:

变量说明
$$插入一个 "$"。
$&插入匹配的子串。
$`插入当前匹配的子串左边的内容。
$'插入当前匹配的子串右边的内容。
$n假如第一个参数是 RegExp 对象,并且 n 是个小于100的非负整数,那么插入第 n 个括号匹配的字符串。提示:索引是从1开始

在zhangsan前后添加三个=

let lzx = "=zhangsan=";
console.log(lzx.replace(/zhangsan/g, "$`$`$&$'$'"));

把电话号用 - 连接

let lzx = "(010)99999999 (020)8888888";
console.log(lzx.replace(/\((\d{3,4})\)(\d{7,8})/g, "$1-$2"));

把所有教育汉字加上链接 www.houdunren.com

<body>
  在线教育是一种高效的学习方式,教育是一生的事业
</body>
<script>
  const body = document.body;
  body.innerHTML = body.innerHTML.replace(
    /教育/g,
    `<a href="https://www.zhangsan.com">$&</a>`
  );
</script>

为链接添加上 https ,并补全 www.

<body>
  <main>
    <a style="color:red" href="http://www.zhangsan.com">
      开源系统
    </a>
    <a id="l1" href="http://zhangsan.com">后盾人</a>
    <a href="http://yahoo.com">雅虎</a>
    <h4>http://www.zhangsan.com</h4>
  </main>
</body>
<script>
  const main = document.querySelector("body main");
  const reg = /(<a.*href=['"])(http)(:\/\/)(www\.)?/gi;
  main.innerHTML = main.innerHTML.replace(reg, (v, ...args) => {
    args[1] += "s";
    args[3] = args[3] || "www.";
  });
</script>

将标题标签全部替换为 p 标签

<body>
  <h1>baidu.com</h1>
  <h2>zhangsan.com</h2>
  <h1>lzx</h1>
</body>

<script>
  const reg = /<(h[1-6])>(.*?)<\/\1>/g;
  const body = document.body.innerHTML;
  const html = body.replace(reg, function(str, tag, content) {
    return `<p>${content}</p>`;
  });
  document.body.innerHTML = html;
</script>

删除页面中的 h1~h6 标签

<body>
  <h1>baidu.com</h1>
  <h2>juejin.cn</h2>
  <h1>掘金</h1>
</body>
<script>
  const reg = /<(h[1-6])>(.*?)<\/\1>/g;
  const body = document.body.innerHTML;
  const html = body.replace(reg, "");
  document.body.innerHTML = html;
</script>

回调函数

replace 支持回调函数操作,用于处理复杂的替换逻辑

变量名代表的值
match匹配的子串。(对应于上述的$&。)
p1,p2, ...假如replace()方法的第一个参数是一个 RegExp 对象,则代表第n个括号匹配的字符串。(对应于上述的11,2等。)例如,如果是用 /(\a+)(\b+)/ 这个来匹配,p1 就是匹配的 \a+,p2 就是匹配的 \b+。
offset匹配到的子字符串在原字符串中的偏移量。(比如,如果原字符串是 'abcd',匹配到的子字符串是 'bc',那么这个参数将会是 1)
string被匹配的原字符串。
NamedCaptureGroup命名捕获组匹配的对象

使用回调函数将 lzx 添加上链接

<body>
  <div class="content">
    lzx 不断更新优学习笔记
  </div>
</body>

<script>
  let content = document.querySelector(".content");
  content.innerHTML = content.innerHTML.replace("lzx", function(
    search,
    pos,
    source
  ) {
    return `<a href="https://www.juejin.com">${search}</a>`;
  });
</script>

为所有标题添加上 hot 类

<body>
  <div class="content">
    <h1>lzx</h1>
    <h2>juejin.com</h2>
    <h1>lzx</h1>
  </div>
</body>
<script>
  let content = document.querySelector(".content");
  let reg = /<(h[1-6])>([\s\S]*?)<\/\1>/gi;
  content.innerHTML = content.innerHTML.replace(
    reg,
    (
      search, //匹配到的字符
      p1, //第一个原子组
      p2, //第二个原子组
      index, //索引位置
      source //原字符
    ) => {
      return `
    <${p1} class="hot">${p2}</${p1}>
    `;
    }
  );
</script>

正则方法

下面是 RegExp 正则对象提供的操作方法

test

检测输入的邮箱是否合法

<body>
  <input type="text" name="email" />
</body>

<script>
  let email = document.querySelector(`[name="email"]`);
  email.addEventListener("keyup", e => {
    console.log(/^\w+@\w+\.\w+$/.test(e.target.value));
  });
</script>

exec

不使用 g 修饰符时与 match 方法使用相似,使用 g 修饰符后可以循环调用直到全部匹配完。

使用 g 修饰符多次操作时使用同一个正则,即把正则定义为变量使用
使用 g 修饰符最后匹配不到时返回 null

计算内容中 lzx 出现的次数

<body>
  <div class="content">
    lzx不断分享学习笔记,lzx会努力学习
  </div>
</body>

<script>
  let content = document.querySelector(".content");
  let reg = /(?<tag>lzx)/g;
  let num = 0;
  while ((result = reg.exec(content.innerHTML))) {
    num++;
  }
  console.log(`lzx共出现${num}次`);
</script>

断言匹配

断言虽然写在扩号中但它不是组,所以不会在匹配结果中保存,可以将断言理解为正则中的条件。

(?=exp)

零宽先行断言 ?=exp 匹配后面为 exp 的内容

把后面是会努力的lzx汉字加上链接

<body>
  <main>
    lzx不断分享学习笔记,lzx会努力学习
  </main>
</body>

<script>
  const main = document.querySelector("main");
  const reg = /lzx(?=会努力)/gi;
  main.innerHTML = main.innerHTML.replace(
    reg,
    v => `<a href="https://juejin.com">${v}</a>`
  );
</script>

下面是将价格后面 添加上 .00

<script>
  let lessons = `
    js,200元,300次
    php,300.00元,100次
    node.js,180元,260次
  `;
  let reg = /(\d+)(.00)?(?=元)/gi;
  lessons = lessons.replace(reg, (v, ...args) => {
    args[1] = args[1] || ".00";
    return args.splice(0, 2).join("");
  });
  console.log(lessons);
</script>

使用断言验证用户名必须为五位,下面正则体现断言是不是组,并且不在匹配结果中记录

<body>
  <input type="text" name="username" />
</body>

<script>
  document
    .querySelector(`[name="username"]`)
    .addEventListener("keyup", function() {
      let reg = /^(?=[a-z]{5}$)/i;
      console.log(reg.test(this.value));
    });
</script>

(?<=exp)

零宽后行断言 ?<=exp 匹配前面为 exp 的内容

匹配前面是 lzx 的数字

let lzx = "lzx789zhangsan666";
let reg = /(?<=lzx)\d+/i;
console.log(lzx.match(reg)); //789

匹配前后都是数字的内容

let lzx = "lzx789hdzhangsan666";
let reg = /(?<=\d)[a-z]+(?=\d{3})/i;
console.log(lzx.match(reg));

所有超链接替换为juejin.com

<body>
  <a href="https://baidu.com">百度</a>
  <a href="https://yahoo.com">雅虎</a>
</body>
<script>
  const body = document.body;
  let reg = /(?<=<a.*href=(['"])).+?(?=\1)/gi;
  // console.log(body.innerHTML.match(reg));
  body.innerHTML = body.innerHTML.replace(reg, "https://juejin.com");
</script>

下例中将 lzx 后面的学习添加上链接

<body>
  <h1>lzx学习后,不断更新笔记</h1>
</body>

<script>
  let h1 = document.querySelector("h1");
  let reg = /(?<=lzx)学习/;
  h1.innerHTML = h1.innerHTML.replace(reg, str => {
    return `<a href="https://www.juejin.com">${str}</a>`;
  });
</script>

将电话的后四位模糊处理

let users = `
  lzx电话: 12345678901
  zhangsan电话: 98745675603
`;

let reg = /(?<=\d{7})\d+\s*/g;
users = users.replace(reg, str => {
  return "*".repeat(4);
});
console.log(users); //lzx电话: 1234567****zhagnsan电话: 9874567****

获取标题中的内容

let lzx = `<h1>lzx</h1>`;
let reg = /(?<=<h1>).*(?=<\/h1>)/g;
console.log(lzx.match(reg));

(?!exp)

零宽负向先行断言 后面不能出现 exp 指定的内容

使用 (?!exp)字母后面不能为两位数字

let lzx = "zhangsan12";
let reg = /[a-z]+(?!\d{2})$/i;
console.table(reg.exec(lzx));

下例为用户名中不能出现 lzx

<body>
  <main>
    <input type="text" name="username" />
  </main>
</body>
<script>
  const input = document.querySelector(`[name="username"]`);
  input.addEventListener("keyup", function() {
    const reg = /^(?!.*lzx.*)[a-z]{5,6}$/i;
    console.log(this.value.match(reg));
  });
</script>

(?<!exp)

零宽负向后行断言 前面不能出现 exp 指定的内容

获取前面不是数字的字符

let lzx = "lzx99zhangsan";
let reg = /(?<!\d+)[a-z]+/i;
console.log(reg.exec(lzx));