Java 使用 Document 操作html 标签内容

379 阅读1分钟

一次偶然的机会去清洗数据库中一些文本中包含 image.png中src 的统一路径,然后需要读取html 中的属性src,并且再次回填回去。

Document doc = Jsoup.parse(str);
Elements elements = doc.getElementsByTag("img");
for (int i = 0; i < elements.size(); i++) {
    Element e = elements.get(i);
    String url = e.attr("src");
    e.attr("src", allUrl);
}
str = StringEscapeUtils.unescapeHtml(doc.body().html());

以下是没有标签,创建标签代码

Document doc = new Document("");
Element e = doc.createElement("img");
e.attr("src", imgUrl);