XML

237 阅读1分钟

简介

XML是可扩展标记语言(extensible Markup Language)缩写,它是一种数据格式,用来表述复杂的数据结构,常用于传输和存储数据。

例如:

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE note SYSTEM "book.dtd">
<book id="1">
    <name>Java核心技术</name>
    <author>Cay S. Horstmann</author>
    <isbn lang="CN">1234567</isbn>
    <tags>
        <tag>Java</tag>
        <tag>Network</tag>
    </tags>
    <pubDate/>
</book>

特点:

  • 纯文本
  • 默认编码UTF-8

常见的特殊字符如下

字符表示
<<
>
&&
""
''
<books>
   <book sn="SN123124">
       <name>时间简史</name>
       <author>霍金</author>
       <price>75</price>
   </book>
   <book sn="SN12fds3124">
       <name>java从入门到放弃</name>
       <author>吴老师</author>
       <price>7</price>
       <text>
           <![CDATA[
               fdsjlfsdfjdsl..mm.,<><><>
           ]]>
       </text>
   </book>
</books>

XML解析

不管是xml还是html都是标记文档,并且遵循w3c制定dom技术解析

document对象表示整个文档,可以是html或者xml等标记语言

早期JDK为我们提供解析技术DOM和Sax (已过时)

image.png

第三方解析:

  • jdom dom基础上封装
  • dom4j 对jdom进行封装
  • pull 主要是Android手机开发,和sax一样基于事件机制解析

具体类库参考