XML(eXtensible Markup Language)是一种用于表示结构化数据的标记语言,被广泛应用于Web开发和数据交换。在Java中,有多种方式可以解析XML文档,本文将介绍三种常用的解析技术:DOM、SAX和StAX,并提供相应的示例代码。
DOM解析
DOM(Document Object Model)解析是一种基于树形结构的解析技术。它将整个XML文档加载到内存中,并构建一个树结构,通过操作树节点来访问和修改XML数据。
使用DOM解析XML的代码示例:
java复制
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import java.io.File;
public class DOMParserExample {
public static void main(String[] args) {
try {
File inputFile = new File("input.xml");
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(inputFile);
// 获取根元素
Element rootElement = document.getDocumentElement();
// 遍历子元素
NodeList nodeList = rootElement.getChildNodes();
for (int i = 0; i < nodeList.getLength(); i++) {
Node node = nodeList.item(i);
if (node.getNodeType() == Node.ELEMENT_NODE) {
Element element = (Element) node;
String name = element.getTagName();
String value = element.getTextContent();
System.out.println(name + ": " + value);
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
在上述示例代码中,我们首先创建一个DocumentBuilderFactory实例,并利用它创建一个DocumentBuilder实例。然后,通过DocumentBuilder实例的parse方法读取XML文件并将其解析为一个Document对象。接下来,我们可以通过Document对象获取根元素,并遍历其子元素,获取节点名称和内容。
SAX解析
SAX(Simple API for XML)解析是一种基于事件驱动的解析技术。通过逐行解析XML文档,当解析器遇到XML标签的开始和结束等事件时,会调用对应的回调方法进行处理。
使用SAX解析XML的代码示例:
java复制
import java.io.File;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class SAXParserExample {
public static void main(String[] args) {
try {
File inputFile = new File("input.xml");
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
CustomHandler customHandler = new CustomHandler();
parser.parse(inputFile, customHandler);
} catch (Exception e) {
e.printStackTrace();
}
}
private static class CustomHandler extends DefaultHandler {
boolean bName = false;
boolean bValue = false;
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
if (qName.equalsIgnoreCase("name")) {
bName = true;
} else if (qName.equalsIgnoreCase("value")) {
bValue = true;
}
}
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
if (qName.equalsIgnoreCase("item")) {
System.out.println();
}
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
if (bName) {
System.out.print("Name: " + new String(ch, start, length));
bName = false;
} else if (bValue) {
System.out.print("Value: " + new String(ch, start, length));
bValue = false;
}
}
}
}
在上述示例代码中,我们首先创建一个SAXParserFactory实例,并利用它创建一个SAXParser实例。然后,我们定义一个继承自DefaultHandler的自定义处理器CustomHandler,重写了startElement、endElement和characters方法,分别处理XML标签开始、结束和内容事件。最后,我们通过SAXParser实例的parse方法解析XML文件,并将解析结果传递给自定义处理器进行处理。
StAX解析
StAX(Streaming API for XML)解析是一种基于流的解析技术。它提供了一种类似于XMLStreamReader的迭代方式,可以逐个读取XML文档的元素、属性和内容。
使用StAX解析XML的代码示例:
java复制
import java.io.FileInputStream;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamReader;
import javax.xml.stream.XMLStreamConstants;
public class StAXParserExample {
public static void main(String[] args) {
try {
XMLInputFactory factory = XMLInputFactory.newInstance();
FileInputStream inputStream = new FileInputStream("input.xml");
XMLStreamReader reader = factory.createXMLStreamReader(inputStream);
while (reader.hasNext()) {
int eventType = reader.next();
if (eventType == XMLStreamConstants.START_ELEMENT) {
String name = reader.getLocalName();
String value = reader.getElementText();
System.out.println(name + ": " + value);
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
在上述示例代码中,我们首先创建一个XMLInputFactory实例,然后使用它创建一个XMLStreamReader实例,并通过createXMLStreamReader方法指定输入流。接下来,我们利用XMLStreamReader的hasNext和next方法逐个读取XML文档的事件类型,并根据需要获取元素的名称和内容。
通过DOM、SAX和StAX这三种XML解析技术,我们可以根据实际需要选择适合的方式来解析XML文档,并获取其中的数据。