好程序员大数据教程分享Scala系列之文件以及正则表达式
1 读取行
导入scala.io.Source后,即可引用Source中的方法读取文件信息。
import scala.io.Source
object FileDemo extends App{
val source = Source.fromFile("C:/Users/admin/res.txt")
val lines = source.getLines()
for(i <- lines)
println(i)
}
2 读取字符
按字符读取文件中的内容
import scala.io.Source
object FileDemo extends App{
val source = Source.fromFile("C:/Users/admin/res.txt")
for(c <- source)
println(c)
}
3 读取单词
把文件中的内容,转换成一个单词的数组
import scala.io.Source
object FileDemo extends App{
val source = Source.fromFile("C:/Users/admin/res.txt")
val contents = source.mkString.split(" ")
for(word <- contents)
println(word)
}
4 读取网络文件
Source可以直接读取来自URL等非文件源的内容
import scala.io.Source
object FileDemo extends App{
val source = Source.fromURL("http://www.baidu.com")
val lines = source.getLines()
for(i <- lines)
println(i)
}
5 写文件
scala 没有内建的对写入文件的支持,要写入文件,使用Java.io.PrintWriter
val out = new PrintWriter("numbers.txt")
for(i <- 1 to 100) out.println(i)
out.close
6 正则表达式
构造一个Regex对象,用String类的r方法或者使用new Regex(" ")
如果正则表达式中包含反斜杠或者引号的化,可以使用""" """
object RegexDemo extends App{
val numPattern ="[0-9]+".r
val matchStr ="98 bottles,99bottles"
for (matchStr <- numPattern.findAllIn(matchStr))
println(matchStr)
val wsnumPattern ="""\s+[0-9]+\s+"""
val first = numPattern.findFirstIn(matchStr)
println(first)
val ifStartMatch = numPattern.findPrefixOf(matchStr)
println(ifStartMatch)
val res1 = numPattern.replaceFirstIn(matchStr,"xx")
println(res1)
val res2 = numPattern.replaceAllIn(matchStr,"xx")
println(res2)
}
6 正则表达式组
分组可以让我们方便地获取正则表达式的子表达式。在你想要提取的子表达式两侧加上圆括号
object RegexDemo extends App{
val numitemPattern="""([0-9]+) ([a-z]+)""".r
val line="666 spark"
for(numitemPattern(num,item) <- numitemPattern.findAllIn(line)){
println(num+"\t"+item)
}
line match{
case numitemPattern(num,item)=> println(num+"\t"+item)
case _=>println("Nothing matched")
}
}
本文为原创文章,未经允许请勿转载!