【JAVA】【正则表达式】【HTML】页面有标签,内容拿不到?用正则一一拿下!

152 阅读2分钟

一、什么是正则表达式?作用与效果

正则表达式,又称规则表达式。

二、详细分类

主要以java的正则为标准

【寻找src属性的正则】

public static String srcRegx = "src=['\"](.*?)['\"]";
public static Pattern srcPattern = Pattern.compile(srcRegx, Pattern.CASE_INSENSITIVE); //寻找src属性的正则

【寻找href属性的正则】

public static String hrefRegx = "href=['\"](.*?)['\"]";
public static Pattern hrefPattern = Pattern.compile(hrefRegx, Pattern.CASE_INSENSITIVE); // 寻找href属性的正则

【寻找url属性的正则】

public static String urlRegx = "url\\(['\"]{0,1}(.*?)['\"]{0,1}\\)";
public static Pattern urlPattern = Pattern.compile(urlRegx, Pattern.CASE_INSENSITIVE); // 寻找url属性的正则
        
public static String styleRegex = "[\\s]*<style[^>]*?>[\\s\\S]*?</style>[\\s]*"; // style标签正则 懒惰模式正则
public static String codeRegex = "[\\s]*<code[^>]*?>[\\s\\S]*?</code>[\\s]*"; // code标签正则
public static String scriptRegex = "[\\s]*<script[^>]*?>[\\s\\S]*?</script>[\\s]*"; // js正则
public static String noscriptRegex = "<noscript[^>]*?>[\\s\\S]*?</noscript>"; // js正则

public static String noteRegex = "<!--([\\s\\S]*?)-->"; // 注释正则 <!--.*-->
public static String labelRegex = "<[^>]+>"; // 所有标签正则

public static String inputRegex = "<input[^<>]*value=['\"](.*?)['\"][^<>]*>"; // 输入框正则表达式
	public static Pattern inputPattern = Pattern.compile(inputRegex, Pattern.CASE_INSENSITIVE);// 编译正则表达式,无论大小写
	public static String metaRegex = "<meta[^<>]*content=['\"](.*?)['\"][^<>]*/>"; // meta标签(数据的数据信息)
	public static Pattern metaPattern = Pattern.compile(metaRegex, Pattern.CASE_INSENSITIVE);// 编译正则表达式,无论大小写

【寻找url绝对路径】

        // 第一个参数绝对路径,第二个参数,相对路径
	public static String finishUrlPath(String absolutePath, String relativePath) {
		try {
			URL absoluteUrl = new URL(absolutePath); // 绝对路径
			URL parseUrl = new URL(absoluteUrl, relativePath);
			return parseUrl.toString();
		} catch (MalformedURLException e) {
			return null;
		}
	}

文章小尾巴

文章写作、模板、文章小尾巴可参考:《写作“小心思”》
  感谢你看到最后,最后再说两点~
  ①如果你持有不同的看法,欢迎你在文章下方进行留言、评论。
  ②如果对你有帮助,或者你认可的话,欢迎给个小点赞,支持一下~
  我是南方者,一个热爱计算机更热爱祖国的南方人。

  (文章内容仅供学习参考,如有侵权,非常抱歉,请立即联系作者删除。)