简介
XML是可扩展标记语言(extensible Markup Language)缩写,它是一种数据格式,用来表述复杂的数据结构,常用于传输和存储数据。
例如:
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE note SYSTEM "book.dtd">
<book id="1">
<name>Java核心技术</name>
<author>Cay S. Horstmann</author>
<isbn lang="CN">1234567</isbn>
<tags>
<tag>Java</tag>
<tag>Network</tag>
</tags>
<pubDate/>
</book>
特点:
- 纯文本
- 默认编码UTF-8
常见的特殊字符如下
| 字符 | 表示 |
|---|---|
| < | < |
| > | |
| & | & |
| " | " |
| ' | ' |
<books>
<book sn="SN123124">
<name>时间简史</name>
<author>霍金</author>
<price>75</price>
</book>
<book sn="SN12fds3124">
<name>java从入门到放弃</name>
<author>吴老师</author>
<price>7</price>
<text>
<![CDATA[
fdsjlfsdfjdsl..mm.,<><><>
]]>
</text>
</book>
</books>
XML解析
不管是xml还是html都是标记文档,并且遵循w3c制定dom技术解析
document对象表示整个文档,可以是html或者xml等标记语言
早期JDK为我们提供解析技术DOM和Sax (已过时)
第三方解析:
- jdom dom基础上封装
- dom4j 对jdom进行封装
- pull 主要是Android手机开发,和sax一样基于事件机制解析