以下示例将从本地文件加载HTML文件,返回一个Document文档,然后查找其数据。
File input=new File(xxxxx); Document document=Jsoup.parse(input, "UTF-8");
Jsoup.parse示例
使用您选择的任何编辑器在C:/> jsoup中创建以下Java程序。
JsoupTester.java
import java.io.File;
import java.io.IOException;
import java.net.URISyntaxException;
import java.net.URL;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class JsoupTester {
public static void main(String[] args) throws IOException, URISyntaxException {
URL path = ClassLoader.getSystemResource("test.htm");
File input = new File(path.toURI());
Document document = Jsoup.parse(input, "UTF-8");
System.out.println(document.title());
}
}
在C:\jsoup文件夹中创建以下test.htm文件。
<html> <head> <title>Sample Title</title> </head> <body> <p>Sample Content</p> </body> </html>
使用 javac 编译器编译类,如下所示:
C:\jsoup>javac JsoupTester.java
现在运行JsoupTester以查看输出。
C:\jsoup>java JsoupTester
查看输出。
Sample Title