金仓数据库KingbaseES KES V9中XPath介绍
关键字:
KingbaseES、XPath、XML、人大金仓
一、XPath简介
1.1 什么是XPath?
- XPath使用路径表达式在XML文档中进行导航。
- XPath包含一个标准函数库。
- XPath是XSLT的主要元素。
- XPath是一个W3C标准。
1.2 XPath路径表达式
XPath使用路径表达式来选取XML文档中的节点或节点集,这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
1.3 XPath标准函数
XPath含有超过100个内建的函数,这些函数用于字符串值、数值、日期和时间比较、节点和QName处理、序列处理、逻辑值等。
二、XPath术语
2.1 节点(Node)
在XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。XML文档是被作为节点树来对待的。树的根被称为文档节点或根节点。
请看下面这个XML文档:
Harryaaa
2005
29.99
上面这个XML文档中的节点例子:
(文档节点)
aaa(元素节点)
lang=”en”(属性节点)
2.2 基本值(或称原子值,Atomic value)
基本值是无父或无子的节点。
基本值的例子:
aaa
”en”
2.3 项目(Item)
项目是基本值或者节点。
2.4 节点关系
2.4.1 父(Parent)
每个元素以及属性值都有一个父。
在下面的例子中,rowset元素是title、name、year以及price元素的父。
Harryaaa
2005
29.99
2.4.2 子(Chidren)
元素节点可能有零个、一个或多个子。
在下面的例子中,title、name、year以及price元素都是rowset元素的子。
Harryaaa
2005
29.99
2.4.3 同胞(Sibling)
拥有相同的父的节点。
在下面的例子中,title、name、year以及price元素都是同胞:
Harryaaa
2005
29.99
2.4.4 先辈(Ancestor)
某节点的父、父的父,等等。
在下面的例子中,title元素的先辈是row元素和rowset元素。
Harryaaa
2005
29.99
2.4.5 后代(Descendant)
某个节点的子,子的子,等等。
在下面的例子中,rowset的后代是row、title、name、year以及price元素:
Harryaaa
2005
29.99
三、XPath语法
3.1 XML实例文档
Harryaaa
29.99
Learning XMLbbb
39.95
3.2 选取节点
XPath使用路径表达式在XML文档中选取节点。节点是通过沿着路径或step来选取的。下面列出了最有用的路径表达式:
表达式
描述
Nodename
选取此节点的所有子节点。
/
从根节点选取。
//
从匹配选择的当前节点选择文档中节点,而不考虑它们的位置
.
选取当前节点。
..
选取当前节点的父节点。
@
选取属性。
在下面的表格中,我们列出了一些路径表达式以及路径表达式的结果:
路径表达式
结果
rowset
选取rowset节点的所有子节点。
/rowset
选取根节点rowset。
注释:假如路径起始于/,则此路径始终代表某元素的绝对路径。
rowset/row
选取属于rowset的子元素的所有row元素。
//row
选取所有row子元素,而不管它们在文档的位置。
rowset//row
选取属于rowset元素的后代的所有row元素,而不考虑它们在rowset下的什么位置。
//@lang
选取名为lang的所有属性。
谓语(Predicates)用于查找某个特定的节点或者包含某个指定值的节点。
谓语被嵌在方括号中。
在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:
路径表达式
结果
/rowset/row[1]
选取属于rowset子元素的第一个row元素。
/rowset/row[last()]
选取属于rowset子元素的最后一个row元素。
/rowset/row[last()-1]
选取属于rowset的子元素的倒数第二个row元素。
/rowset/row[position()<3]
选取最前面的两个属于rowset子元素的row元素
//title[@lang]
选取所有名为lang的属性的title元素。
//title[@lang=’eng’]
选取所有title元素,且这些元素拥有值为eng的lang属性。
/rowset/row[price>35.00]
选取rowset元素的所有row元素,且其中的price元素的值须大于35.00
/rowset/row[price>35.00]/title
选取rowset元素的row元素的所有title元素,且其中的price元素的值须大于35.00。
3.3 选取未知节点
XPath通配符可用来选取未知的XML元素。
通配符
描述
*
匹配任何元素节点。
@*
匹配任何属性节点。
node()
匹配任何类型节点。
在下面的表格中,我们列出了一些路径表达式,以及表达式的结果:
路径表达式
结果
/rowset/*
选取rowset元素所有子元素。
//*
选取文档中的所有元素。
//title[@*]
选取所有带有属性的title元素。
3.4 选取若干路径
通过在路径表达式中使用“|”运算符,您可以选取若干个路径。
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
路径表达式
结果
//row/title | //row/price
选取row目录下所有的title和price元素。
//title | //price
选取文档中的所有title和price元素。
/rowset/row/title | //price
选取属于rowset元素的row元素的所有title元素和文档中所有的price元素。
四、XPath在Kingbase中的使用
4.1 语法
xpath(xpath, xml [, nsarray])
函数xpath在 XML 值 xml上计算 XPath 1.0 表达式xpath (a text value)。它返回一个 XML值的数组,该数组对应于该 XPath 表达式产生的结点集合。如果该 XPath 表达式返回一个标量值而不是一个结点集合,将会返回一个单一元素的数组。
第二个参数必须是一个良构的 XML 文档。特殊地,它必须有一个单一根节点元素。
该函数可选的第三个参数是一个名字空间映射的数组。这个数组应该是一个二维text数组,其第二轴长度等于2(即它应该是一个数组的数组,其中每一个都由刚好 2 个元素组成)。每个数组项的第一个元素是名字空间的名称(别名),第二个元素是名字空间的URI。并不要求在这个数组中提供的别名和在 XML 文档本身中使用的那些名字空间相同(换句话说,在XML 文档中和在xpath函数环境中,别名都是本地的)。
4.2 示例
test=# SELECT xpath('/my:a/text()', '<my:a xmlns:my="http:// example.com">test</my:a>',ARRAY[ARRAY['my', 'example.com'\]\]);
xpath
--------
{test}
(1 行记录)
要处理默认(匿名)命名空间,做这样的事情:
test=# SELECT xpath('//mydefns:b/text()', 'test',ARRAY[ARRAY['mydefns', 'example.com'\]\]);
xpath
--------
{test}
(1 行记录)
参考文档:
《KingbaseES SQL语言参考手册》