正则表达式的定义
正则表达式(Regular Expression)是一种用于匹配、查找和替换文本中特定模式的字符串。
它的应用场景包括:
- 数据验证。在用户注册、登录等场景中验证输入的信息是否符合要求。
- 文本搜索和替换。在文本编辑器、代码编辑器等工具中,用于查找特定的单词、短语或者代码模式,并进行替换操作。
- 数据提取。从网页内容、日志文件等大量文本数据中提取特定的信息。
正则表达式的使用步骤:
1. 定义匹配规则。写正则表达式
2. 定义数据,准备要匹配的内容。
3.将字符串使用规则进行匹配。
匹配合法手机号的基本代码:
package reg
import java.io.FileWriter
object reg03 {
def main(args: Array[String]): Unit = {
// 1. 从根目录下读出address.txt的内容
val content=scala.io.Source.fromFile("address.txt").mkString
println("读到的文件内容如下:")
println(content)
// 2. 找到其中的合法的手机号,把中间的4位(3-4-4)用*代替
val reg="1[356789]\d{9}".r
// println("找到的合法手机号如下:")
// reg.findAllIn(content).foreach(ele=>println(ele))
// 在content中,把所有通过正规找到的内容,替换成“abc”
val newContent=reg.replaceAllIn(content,ele=>{
val phone=ele.toString()
// println(ele.toString())
// "手机号前三位"+"****"+"手机号的后四位"
phone.substring(0,3)+"****"+phone.substring(7)
})
println("替换后的内容如下:")
println(newContent)
// 3. 把结果写入到address_new.txt文件中
val fileWriter=new FileWriter("address_new.txt")
fileWriter.write(newContent)
fileWriter.close()
}
}
文件内容:
输出结果:
正则表达式的基本组成部分:
- 字符类。包括单个字符和字符范围。
- 量词。用于指定前面的字符或字符组出现的次数。
- 锚点。用于指定匹配的位置。
- 分组。使用括号()来分组。
用()分组写出的代码:
// 1. 从根目录下读出address.txt的内容
val content=scala.io.Source.fromFile("address.txt").mkString
println("读到的文件内容如下:")
println(content)
// 2. 找到其中的合法的手机号,把中间的4位(3-4-4)用*代替
val reg="(1[356789]\d\d)(\d{4})(\d{3})".r // ()是分组
// println("找到的合法手机号如下:")
// reg.findAllIn(content).foreach(ele=>println(ele))
// 在content中,把所有通过正规找到的内容,替换成“abc”
val newContent=reg.replaceAllIn(content,ele=>{
println(ele.group((0)))// 表示固定搭配
// 顺序对应正则表达式中,()包含的内容
println(ele.group((1)))
println(ele.group((2)))
println(ele.group((3)))
// val phone=ele.toString()
// println(ele.toString())
// "手机号前三位"+"****"+"手机号的后四位"
// phone.substring(0,3)+"****"+phone.substring(7)
ele.group(1)+"-****-"+ele.group(3)
})
println("替换后的内容如下:")
println(newContent)
// 3. 把结果写入到address_new.txt文件中
val fileWriter=new FileWriter("address_new.txt")
fileWriter.write(newContent)
fileWriter.close()