正则表达式

46 阅读2分钟

正则表达式的定义

正则表达式(Regular Expression)是一种用于匹配、查找和替换文本中特定模式的字符串

基本组成部分

无论多么复杂的正则表达式,都是由如下4个部分组成

1.字符类。包括单个字符和字符范围。例如,a匹配字符a,[abc]匹配a、b或者c中的任意一个字符,[a-z]匹配从a到z的任意一个小写字母。

2.量词。用于指定前面的字符或字符组出现的次数。例如,*表示前面的字符可以出现0次或多次,+表示前面的字符至少出现1次,?表示前面的字符最多出现1次。

3.锚点。用于指定匹配的位置。例如,^表示匹配行首,表示匹配行尾abc表示匹配以abc开头的行,abc表示匹配行尾。^abc表示匹配以abc开头的行,abc表示匹配以abc结尾的行。

4.分组。使用括号()来分组。例如,(ab)+表示ab这个组合至少出现1次,如ab、abab、ababab等符合要求。分组还可以用于提取匹配的子字符串等操作

处理字符

1.处理字符 2.匹配:在一个大的字符串中,寻找是否有满足 规则(条件)的子串 3.查找、校验、判断给定的字符串是否满足某些 规则(条件)

这里的 规则(条件)就是利用 正则表达式 来的特殊的字符串。

!!!!!!!!正则表达式具体的语法后面先!!!!!!!!

是一个独立,通用的计算机技术。

object reg01 {
    def main(args: Array[String]): Unit = {
      // 1、定义正则表达
      // 2、给定要检查(验证)的目标字符串
      // 3、调用正则表达式,输出结果

      // 例子:判断给定字符串中是否是纯数字?
      
      // ^\d{11}$:必须是以11个数字开头并且以11个数字结尾的字符串 ===== 恰好11位字符,并且全是数字!

      // 1. \d:  它可以表达任意的一个数字

      // 量词:表示前面的规则要重复几次?
      // 1. {11}:表示重复11次。 \d{11} 它可以表示一个 11位的数字

      // 1. 定义正则表达
      val reg = "\d{11}".r
      // 2. 给要检查(验证)的目标字符串
      val target = "i like 喜欢 数字 20002181099!"
      println("找到的结果是:")
      reg.findAllIn(target).foreach(println)

//      println("\")  // tab
    }
}

案例-找出字符串中的生日

1. 匹配一个数字。\d

2. 匹配两个数字。\d\d

3. 匹配11个数字。\d{11}

4. 匹配11个数字,并且以1开头。1\d{10}

5. 只能匹配11个数字,不能多也不能少。^1\d{10}$

6. 第2位可以是3,5,6,7,8,9。^1[356789]\d{9}$

object reg03 {
    def main(args: Array[String]): Unit = {
      // 1、定义正则表达
      // 2、给定要检查(验证)的目标字符串
      // 3、调用正则表达式,输出结果

      // 例子:判断给定字符串中是否是纯数字?

      // 1. \d:  它可以表达任意的一个数字
      // 2.[356789]:只能固定字符中的某一个

      // 量词:表示前面的规则要重复几次?
      // 1. {11}:表示重复11次。 \d{11} 它可以表示一个 11位的数字

      // ^ 以此开头。 ^\d{11} 必须是以11个数字开头的字符串。
      // $ 以此结尾。 \d{11}$ 必须是以11个数字结尾的字符串

      // ^\d{11}$:必须是以11个数字开头并且以11个数字结尾的字符串 ===== 恰好11位字符,并且全是数字!

      // 1. 定义正则表达
      //val reg = "^\d{11}$".r
      //val reg = "^1\d{11}$".r  // 第一位是1,后边跟十个数字

      // 手机号的第二位: 3,5,6,7,8,9
      val reg = "^1[356789]\d{9}$".r  // 第1位是1,第2位是356789中的某一个,后边跟9个数字

      // 2. 给要检查(验证)的目标字符串
      val target = "13002181099"
      println("找到的结果是:")
      reg.findAllIn(target).foreach(println)

//      println("\")  // tab
    }
}