XML 特殊字符处理和 CDATA
2014-01-14 16:47
337 查看
在处理XML数据时,特殊字符要特殊处理,不能和节点字符混淆。 所有 XML 文档中的文本均会被解析器解析。 只有 CDATA 区段(CDATA section)中的文本会被解析器忽略。 PCDATA PCDATA 指的是被解析的字符数据(Parsed Character Data)。 XML 解析器通常会解析 XML 文档中所有的文本。 当某个 XML 元素被解析时,其标签之间的文本也会被解析: <message>此文本也会被解析</message> 解析器之所以这么做是因为 XML 元素可包含其他元素,就像这个例子中,其中的 <name> 元素包含着另外的两个元素(first 和 last): <name><first>Bill</first><last>Gates</last></name> 而解析器会把它分解为像这样的子元素: <name> <first>Bill</first> <last>Gates</last> </name> 转义字符 非法的 XML 字符必须被替换为实体引用(entity reference)。 假如您在 XML 文档中放置了一个类似 "<" 字符,那么这个文档会产生一个错误,这是因为解析器会把它解释为新元素的开始。因此你不能这样写: <message>if salary < 1000 then</message> 为了避免此类错误,需要把字符 "<" 替换为实体引用,就像这样: <message>if salary < 1000 then</message> 在 XML 中有 5 个预定义的实体引用:
注释:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。 CDATA 术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。 在 XML 元素中,"<" 和 "&" 是非法的。 "<" 会产生错误,因为解析器会把该字符解释为新元素的开始。 "&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。 某些文本,比如 JavaScript 代码,包含大量 "<" 或 "&" 字符。为了避免错误,可以将脚本代码定义为 CDATA。 CDATA 部分中的所有内容都会被解析器忽略。 CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束: <script> <![CDATA[ function matchwo(a,b) { if (a < b && a < 0) then { return 1; } else { return 0; } } ]]> </script> 在上面的例子中,解析器会忽略 CDATA 部分中的所有内容。 关于 CDATA 部分的注释: CDATA 部分不能包含字符串 "]]>"。也不允许嵌套的 CDATA 部分。 标记 CDATA 部分结尾的 "]]>" 不能包含空格或折行。 摘自:http://www.w3school.com.cn/xml/xml_cdata.asp
< | < | 小于 |
> | > | 大于 |
& | & | 和号 |
' | ' | 单引号 |
" | " | 双引号 |
相关文章推荐
- xml 对特殊字符的处理(添加cdata标签)
- XML的CDATA区域(无视特殊字符,一般用在需要多处处理转义的语句中)
- xml特殊字符处理的两种方式:实体引用和CDATA
- XML 特殊字符处理和 CDATA
- 处理内容有&特殊字符thinkphp返回xml无法解析的问题<![CDATA[xxx]]>
- XML 特殊字符处理和 CDATA
- 处理XML字符串中特殊字符
- xml特殊字符处理
- xml 特殊字符处理
- oracle字段xml特殊字符处理
- 处理XML字符串中特殊字符
- 有关XML文档中特殊字符的处理
- XML配置字符串中特殊字符的处理
- XML 特殊字符处理
- xml特殊字符处理 如&
- XML中特殊字符的处理
- C# 生成XML时的特殊字符出现异常处理
- 【转】XML 特殊字符处理
- asp.net webapi 序列化为xml 时实体属性增加<![CDATA[]]>防止特殊字符
- 关于使用dom4j生成xml时特殊字符处理的解决方法