Java富文本框标签过滤

1,213 阅读1分钟

** 2019-11-25 15:13:32 **

今天改【通知】模块的需求,记录一下之前改的需求,

前端说小程序一页面无法对富文本框的标签进行识别转义,后台需要进行一些标签过滤。

一些代码

/**
 * html标签的过滤和清洗
 *
 * @author caoxiang
 * @date 2019/10/30
 */
public class HtmlUtils {
    public static String mySanitizeHtml(String htmlContent) {
        // 过滤文章内容中的html
        htmlContent = htmlContent.replaceAll("</?[^<]+>", "");
        // 去除字符串中的空格 回车 换行符 制表符 等
        htmlContent = htmlContent.replaceAll("\\s*|\t|\r|\n", "");
        // 去除空格
        htmlContent = htmlContent.replaceAll("&nbsp;", "");
        // 去掉其他一些字符
        htmlContent = htmlContent.replaceAll("\\\\", "");
        htmlContent = htmlContent.replaceAll("\\\\\\\\", "");
        // 后面的如果有特殊字符,根据自己需要进行过滤。
        
        // 打印结果
        System.out.println(htmlContent);
        return htmlContent;
    }
}