XML定义文档内容
2008-11-03 17:58
190 查看
DTD 允许您指定 XML 文档的基本结构。下面的几页将研究 DTD 片段。首先是定义本章中地址文档示例的基本结构的 DTD。
<!-- address.dtd -->
<!ELEMENT address (name, street, city, state, postal-code)>
<!ELEMENT name (title? first-name, last-name)>
<!ELEMENT title (#PCDATA)>
<!ELEMENT first-name (#PCDATA)>
<!ELEMENT last-name (#PCDATA)>
<!ELEMENT street (#PCDATA)>
<!ELEMENT city (#PCDATA)>
<!ELEMENT state (#PCDATA)>
<!ELEMENT postal-code (#PCDATA)>
该 DTD 定义了样本文档中使用的所有元素。它定义了三个元素:
所有其它包含文本的元素。(
尽管 DTD 相当简单,但它清楚地说明了什么样的元素组合是合乎规则的。
另外,请注意,DTD 语法不同于普通的 XML 语法。(相反,XML Schema 文档本身就是 XML,这导致一些有趣的结果)。尽管 DTD 的语法不同,但您仍可以将普通的注释放到 DTD 中。
DTD 中的符号
DTD 中有几个符号用于指出某元素在 XML 文档中可能会出现多少次(或是否出现)。下面是一些示例及其含义:
这意味着
这个
如要定义一个 XML 文档的结构,您应该象在应用程序中设计数据库模式或数据结构那样事先考虑 DTD 或模式。您事先考虑的未来需求越多,以后实现它们就越容易而且成本越低
定义属性
定义哪些属性是必需的
定义属性的缺省值
列出给定属性的所有有效值
假设您要更改 DTD,使
[/code]
和以前一样,我们定义了
要定义元素的多个属性,可象下面那样编写
[/code]
该示例将
最后,DTD 允许您定义属性缺省值,并列举属性的所有有效值:
[/code]
上面的示例表明它仅支持来自亚利桑那州(AZ)、加利福尼亚州(CA)、内华达州(NV)、俄勒冈州(OR)、犹他州(UT)和华盛顿州(WA)的地
ca11
址,并且缺省值是加利福尼亚州。这样,您就可以进行形式非常有限的数据验证。
XML 模式
XML 模式使用 XML 语法。换句话说,XML 模式是一个 XML
文档。这意味着您可以象处理任何其它文档一样处理模式。例如,您可以编写一个 XSLT 样式表,该样式表将 XML 模式转换成具有自动生成的
JavaScript 代码的 Web 表单,其中的 JavaScript 代码可以验证您输入的数据。
XML 模式支持数据类型。尽管 DTD 确实支持数据类型,但很明显这些数据类型是从发布的角度开发的。XML 模式支持 DTD 中的所有原始数据类型(诸如标识和标识引用之类的类型)。它们还支持整数、浮点数、日期、时间、字符串、URL 和其它对数据处理和验证有用的数据类型。
XML 模式是可扩展的。除了 XML 模式规范中定义的数据类型以外,您还可以创建自己的数据类型,并且可以基于其它数据类型派生出新的数据类型。
XML 模式有更强的表达能力。例如,您可以用 XML 模式定义任何
下面是与原始名称和地址 DTD 相匹配的 XML 模式。它增加了两个约束:
[/code]
与 DTD 版本一样,XML 模式示例定义
大多数元素包含文本;定义它们很简单。您只要声明新的元素,然后指定它的数据类型为
定义模式中的元素内容
样本模式为两个元素的内容定义了约束:
[/code]
对于
<!-- address.dtd -->
<!ELEMENT address (name, street, city, state, postal-code)>
<!ELEMENT name (title? first-name, last-name)>
<!ELEMENT title (#PCDATA)>
<!ELEMENT first-name (#PCDATA)>
<!ELEMENT last-name (#PCDATA)>
<!ELEMENT street (#PCDATA)>
<!ELEMENT city (#PCDATA)>
<!ELEMENT state (#PCDATA)>
<!ELEMENT postal-code (#PCDATA)>
该 DTD 定义了样本文档中使用的所有元素。它定义了三个元素:
<address>元素包含一个
<name>、一个
<street>、一个
<city>、一个
<state>和一个
<postal-code>。所有这些元素必须出现,而且必须以这个顺序出现。
<name>元素包含一个可选的
<title>元素(问号表示 title 这个元素是可选的),后面跟有一个
<first-name>和一个
<last-name>元素。
所有其它包含文本的元素。(
#PCDATA代表已解析字符数据;不能在这些元素中包含另一个元素。)
尽管 DTD 相当简单,但它清楚地说明了什么样的元素组合是合乎规则的。
<postal-code>元素在
<state>元素之前的地址文档是不合乎规则的,没有
<last-name>元素的文档也不合乎规则。
另外,请注意,DTD 语法不同于普通的 XML 语法。(相反,XML Schema 文档本身就是 XML,这导致一些有趣的结果)。尽管 DTD 的语法不同,但您仍可以将普通的注释放到 DTD 中。
DTD 中的符号
DTD 中有几个符号用于指出某元素在 XML 文档中可能会出现多少次(或是否出现)。下面是一些示例及其含义:
<!ELEMENT address (name, city, state)>
<address>元素必须包含一个
<name>元素、一个
<city>元素和一个
<state>元素,并且符合上面的次序。所有的元素都是必需的。逗号表示项的列表。
<!ELEMENT name (title?, first-name, last-name)>
这意味着
<name>元素包含一个可选的
<title>元素,后面必须跟有一个
<first-name>和一个
<last-name>元素。问号表示这一项是可选的;它可以出现一次或根本不出现。
<!ELEMENT addressbook (address+)>
<addressbook>元素包含一个或多个
<address>元素。您可以有任意多的
<address>元素,但必须至少有一个。加号表示这一项必须至少出现一次,但可出现任意次。
<!ELEMENT private-addresses (address*)>
<private-addresses>元素包含零个或多个
<address>元素。星号表示这一项可以出现任意次,包括零次。
<!ELEMENT name (title?, first-name, (middle-initial | middle-name)?, last-name)>
<name>元素包含一个可选的
<title>元素,后面跟有一个
<first-name>元素,随后可能跟有一个
<middle-initial>或
<middle-name>元素,然后跟有一个
<last-name>元素。换句话说,
<middle-initial>和
<middle-name>都是可选的,而且您只能选择二者中的一个。竖线符号表示选择列表;您只能从列表选择一项。还要注意该示例用圆括号对特定元素进行分组,然后在这个组旁放上问号。
<!ELEMENT name ((title?, first-name, last-name) | (surname, mothers-name, given-name))>
这个
<name>元素可以包含两个序列中的一个:一个可选的
<title>,后面跟有一个
<first-name>和一个
<last-name>;或一个
<surname>、一个
<mothers-name>和一个
<given-name>。
如要定义一个 XML 文档的结构,您应该象在应用程序中设计数据库模式或数据结构那样事先考虑 DTD 或模式。您事先考虑的未来需求越多,以后实现它们就越容易而且成本越低
定义属性
定义哪些属性是必需的
定义属性的缺省值
列出给定属性的所有有效值
假设您要更改 DTD,使
state成为
<city>元素的属性。下面演示如何做到这一点:
<!ELEMENT city (#PCDATA)> <!ATTLIST city state CDATA #REQUIRED>
[/code]
和以前一样,我们定义了
<city>元素,但修改的示例还使用了
ATTLIST声明来列出元素的属性。属性列表中的名称
city告诉解析器这些属性是为
<city>元素定义的。名称
state是属性的名称,关键字
CDATA和
#REQUIRED告诉解析器
state属性包含文本并且是必需的(如果它是可选的,用
CDATA #IMPLIED即可)。
要定义元素的多个属性,可象下面那样编写
ATTLIST:
<!ELEMENT city (#PCDATA)> <!ATTLIST city state CDATA #REQUIRED postal-code CDATA #REQUIRED>
[/code]
该示例将
state和
postal-code都定义为
<city>元素的属性。
最后,DTD 允许您定义属性缺省值,并列举属性的所有有效值:
<!ELEMENT city (#PCDATA)> <!ATTLIST city state CDATA (AZ|CA|NV|OR|UT|WA) "CA">
[/code]
上面的示例表明它仅支持来自亚利桑那州(AZ)、加利福尼亚州(CA)、内华达州(NV)、俄勒冈州(OR)、犹他州(UT)和华盛顿州(WA)的地
ca11
址,并且缺省值是加利福尼亚州。这样,您就可以进行形式非常有限的数据验证。
XML 模式
XML 模式使用 XML 语法。换句话说,XML 模式是一个 XML
文档。这意味着您可以象处理任何其它文档一样处理模式。例如,您可以编写一个 XSLT 样式表,该样式表将 XML 模式转换成具有自动生成的
JavaScript 代码的 Web 表单,其中的 JavaScript 代码可以验证您输入的数据。
XML 模式支持数据类型。尽管 DTD 确实支持数据类型,但很明显这些数据类型是从发布的角度开发的。XML 模式支持 DTD 中的所有原始数据类型(诸如标识和标识引用之类的类型)。它们还支持整数、浮点数、日期、时间、字符串、URL 和其它对数据处理和验证有用的数据类型。
XML 模式是可扩展的。除了 XML 模式规范中定义的数据类型以外,您还可以创建自己的数据类型,并且可以基于其它数据类型派生出新的数据类型。
XML 模式有更强的表达能力。例如,您可以用 XML 模式定义任何
<state>属性值不得超过 2 个字符,或定义任何
<postal-code>元素的值必须与正则表达式
[0-9]{5}(-[0-9]{4})?相匹配。
下面是与原始名称和地址 DTD 相匹配的 XML 模式。它增加了两个约束:
<state>元素的值必须刚好是两个字符长,
<postal-code>元素的值必须与正则表达式
[0-9]{5}(-[0-9]{4})?相匹配。尽管这个模式比 DTD 长很多,但它更清楚地表达了有效的文档看起来是什么样子。下面是模式:
<?xml version="1.0" encoding="UTF-8"?> <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema"> <xsd:element name="address"> <xsd:complexType> <xsd:sequence> <xsd:element ref="name"/> <xsd:element ref="street"/> <xsd:element ref="city"/> <xsd:element ref="state"/> <xsd:element ref="postal-code"/> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="name"> <xsd:complexType> <xsd:sequence> <xsd:element ref="title" minOccurs="0"/> <xsd:element ref="first-Name"/> <xsd:element ref="last-Name"/> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="title" type="xsd:string"/> <xsd:element name="first-Name" type="xsd:string"/> <xsd:element name="last-Name" type="xsd:string"/> <xsd:element name="street" type="xsd:string"/> <xsd:element name="city" type="xsd:string"/> <xsd:element name="state"> <xsd:simpleType> <xsd:restriction base="xsd:string"> <xsd:length value="2"/> </xsd:restriction> </xsd:simpleType> </xsd:element> <xsd:element name="postal-code"> <xsd:simpleType> <xsd:restriction base="xsd:string"> <xsd:pattern value="[0-9]{5}(-[0-9]{4})?"/> </xsd:restriction> </xsd:simpleType> </xsd:element> </xsd:schema>
XML 模式用 元素定义了一些 XML 元素。头两个定义的元素([code]和 )由其它元素组成。 元素定义了包含在这两个元素中的元素的序列。下面是示例:[/code]
<xsd:element name="address"> <xsd:complexType> <xsd:sequence> <xsd:element ref="name"/> <xsd:element ref="street"/> <xsd:element ref="city"/> <xsd:element ref="state"/> <xsd:element ref="postal-code"/> </xsd:sequence> </xsd:complexType> </xsd:element>
[/code]
与 DTD 版本一样,XML 模式示例定义
<address>包含一个
<name>、一个
<street>、一个
<city>、一个
<state>和一个
<postal-code>元素,并且依照上面的次序。请注意,该模式实际上用
<xsd:complexType>元素定义了新的数据类型。
大多数元素包含文本;定义它们很简单。您只要声明新的元素,然后指定它的数据类型为
xsd:string:
<xsd:element name="title" type="xsd:string"/> <xsd:element name="first-Name" type="xsd:string"/> <xsd:element name="last-Name" type="xsd:string"/> <xsd:element name="street" type="xsd:string"/> <xsd:element name="city" type="xsd:string"/>
定义模式中的元素内容
样本模式为两个元素的内容定义了约束:
<state>元素的内容必须是两个字符长,而
<postal-code>元素的内容必须与正则表达式
[0-9]{5}(-[0-9]{4})?匹配。下面演示如何做到那一点:
<xsd:element name="state"> <xsd:simpleType> <xsd:restriction base="xsd:string"> <xsd:length value="2"/> </xsd:restriction> </xsd:simpleType> </xsd:element> <xsd:element name="postal-code"> <xsd:simpleType> <xsd:restriction base="xsd:string"> <xsd:pattern value="[0-9]{5}(-[0-9]{4})?"/> </xsd:restriction> </xsd:simpleType> </xsd:element>
[/code]
对于
<state>和
<postal-code>元素,模式用约束定义了新的数据类型。第一个情况使用
<xsd:length>元素,而第二个情况则使用
<xsd:pattern>元素定义该元素必须匹配的正则表达式。
相关文章推荐
- 通过php删除xml文档内容的方法
- 有效的XML: DTD(文档类型定义)介绍与三种使用方式
- XML文档定义有几种形式?它们之间有何本质区别?解析XML文档有哪几种方式?
- 在Visual studio 2010中为C#的“///”注释内容生成XML文档
- XML--- XML文档类型定义(DTD)
- XML(Extenxible Markup Language)可扩展标记语言,DTD(Document Type Definition)文档类型定义
- 读取Xml文档里的所有内容
- C#中通过XmlDocument操作Xml文档(新建XML、新增节点、删除节点、显示文档内容)
- DEDE利用自由列表创建全站RSS订阅内容更新整站.xml文档
- XML文档类型定义 DTD详解
- NSIS ---使用nsDialogs创建自定义页面,并获取输入到控件中的内容保存到一个XML文档中
- 使用DOM方法实现xml文档内容的解析与写入
- XML文档类型定义---DTD文档
- XML系列:文档类型定义DTD (转)
- XML解析之sax解析案例(一)读取contact.xml文件,完整输出文档内容
- 通过树形结构在控制台显示XML文档的全部内容
- SAX Xml->SAXParseException在文档的元素内容中找到无效的 XML 字符 (Unicode: 0x10)
- Android应用中res/drawable文件夹下定义的xml文件内容详解(一)
- 写出内容到xml文档
- Android应用中res/drawable文件夹下定义的xml文件内容(二)selector