正则表达式简介
正则表达式是由一些特殊含义的字符组成的字符串,多用于查找,替换符合规则的字符串内容
一.字符:
正则表达式中字符是有特殊含义的字符串
常见使用字符有
利用图中字符对应的规则就可以列出相应的正则表达式了
二.代码演示
常见的正则表达式有 身份证,邮箱.
身份证
String regex4="[1-9]\d{5}(?:18|19|20)\d{2}(?:0[1-9]|10|11|12)(?:0[1-9]|[1-2]\d|30|31)\d{3}[\dXx]";
因为正则表达式是字符串所以要用string来记录
邮箱
String regex1="\w+[\w@&&[^_]]{2,6}(\.[a-zA-Z]{2,3}){1,2}";
三.快速方法
打开心爱的ideal在设置中找到插件搜索any-rule 安装后当我们需要一个对应得正则表达式的时候在string里面的""中鼠标右键点击搜索想要的表达式就行了,当然这个插件给的正则表达式中转义字符就一个\所以自己再进行修改.
四.爬取
爬取:顾名思义爬取一段文本中自己需要的内容
首先要了解到一些知识:
pattern:表示正则表示式
matcher:文本匹配器,作用按照正则表达式的规则去读取字符,从头开始读取.
在字符串中去找符合匹配规则的字符串
String str="****000*0000*00***";
pattern p=pattern.compile("0+");
Matcher m=p.matcher(str);
m.find();
从文本匹配器开始读取,寻找 是否有满足规则的子串如果没有 返回false
如果有返回true,在底层记录的起始索引和结果+1
String s1=m.group();
方法会根据find方法记录的索引进行字符串的截取