java解析xml

140 阅读3分钟

XML(eXtensible Markup Language)是一种用于表示结构化数据的标记语言,被广泛应用于Web开发和数据交换。在Java中,有多种方式可以解析XML文档,本文将介绍三种常用的解析技术:DOM、SAX和StAX,并提供相应的示例代码。

DOM解析

DOM(Document Object Model)解析是一种基于树形结构的解析技术。它将整个XML文档加载到内存中,并构建一个树结构,通过操作树节点来访问和修改XML数据。

使用DOM解析XML的代码示例:

java复制

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import java.io.File;

public class DOMParserExample {

    public static void main(String[] args) {
        try {
            File inputFile = new File("input.xml");
            DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
            DocumentBuilder builder = factory.newDocumentBuilder();
            Document document = builder.parse(inputFile);
            
            // 获取根元素
            Element rootElement = document.getDocumentElement();
            
            // 遍历子元素
            NodeList nodeList = rootElement.getChildNodes();
            for (int i = 0; i < nodeList.getLength(); i++) {
                Node node = nodeList.item(i);
                if (node.getNodeType() == Node.ELEMENT_NODE) {
                    Element element = (Element) node;
                    String name = element.getTagName();
                    String value = element.getTextContent();
                    System.out.println(name + ": " + value);
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

在上述示例代码中,我们首先创建一个DocumentBuilderFactory实例,并利用它创建一个DocumentBuilder实例。然后,通过DocumentBuilder实例的parse方法读取XML文件并将其解析为一个Document对象。接下来,我们可以通过Document对象获取根元素,并遍历其子元素,获取节点名称和内容。

SAX解析

SAX(Simple API for XML)解析是一种基于事件驱动的解析技术。通过逐行解析XML文档,当解析器遇到XML标签的开始和结束等事件时,会调用对应的回调方法进行处理。

使用SAX解析XML的代码示例:

java复制

import java.io.File;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SAXParserExample {
  
    public static void main(String[] args) {
        try {
            File inputFile = new File("input.xml");
            SAXParserFactory factory = SAXParserFactory.newInstance();
            SAXParser parser = factory.newSAXParser();
            CustomHandler customHandler = new CustomHandler();
            parser.parse(inputFile, customHandler);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    private static class CustomHandler extends DefaultHandler {
        
        boolean bName = false;
        boolean bValue = false;
        
        @Override
        public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
            if (qName.equalsIgnoreCase("name")) {
                bName = true;
            } else if (qName.equalsIgnoreCase("value")) {
                bValue = true;
            }
        }

        @Override
        public void endElement(String uri, String localName, String qName) throws SAXException {
            if (qName.equalsIgnoreCase("item")) {
                System.out.println();
            }
        }

        @Override
        public void characters(char[] ch, int start, int length) throws SAXException {
            if (bName) {
                System.out.print("Name: " + new String(ch, start, length));
                bName = false;
            } else if (bValue) {
                System.out.print("Value: " + new String(ch, start, length));
                bValue = false;
            }
        }
    }
}

在上述示例代码中,我们首先创建一个SAXParserFactory实例,并利用它创建一个SAXParser实例。然后,我们定义一个继承自DefaultHandler的自定义处理器CustomHandler,重写了startElementendElementcharacters方法,分别处理XML标签开始、结束和内容事件。最后,我们通过SAXParser实例的parse方法解析XML文件,并将解析结果传递给自定义处理器进行处理。

StAX解析

StAX(Streaming API for XML)解析是一种基于流的解析技术。它提供了一种类似于XMLStreamReader的迭代方式,可以逐个读取XML文档的元素、属性和内容。

使用StAX解析XML的代码示例:

java复制

import java.io.FileInputStream;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamReader;
import javax.xml.stream.XMLStreamConstants;

public class StAXParserExample {
    
    public static void main(String[] args) {
        try {
            XMLInputFactory factory = XMLInputFactory.newInstance();
            FileInputStream inputStream = new FileInputStream("input.xml");
            XMLStreamReader reader = factory.createXMLStreamReader(inputStream);

            while (reader.hasNext()) {
                int eventType = reader.next();
                if (eventType == XMLStreamConstants.START_ELEMENT) {
                    String name = reader.getLocalName();
                    String value = reader.getElementText();
                    System.out.println(name + ": " + value);
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

在上述示例代码中,我们首先创建一个XMLInputFactory实例,然后使用它创建一个XMLStreamReader实例,并通过createXMLStreamReader方法指定输入流。接下来,我们利用XMLStreamReaderhasNextnext方法逐个读取XML文档的事件类型,并根据需要获取元素的名称和内容。

通过DOM、SAX和StAX这三种XML解析技术,我们可以根据实际需要选择适合的方式来解析XML文档,并获取其中的数据。