PS:关于在php生成xml的过程中出现的解析错误的问题,我在这里分享一下我的经验,也许对大多数人来说这个问题过于简单,但是我自己碰上了一定要在这里记录一下,以免以后再出错,同时也可以给碰到该问题的朋友提供一些经验,避免更多人在此问题纠结!
首先我在这做个实例:
这个xml文件用浏览器打开的时候会报错,提示xml解析错误:未组织好……,但是用编译器打开是正常的没有错误(如上图),所以这到底是哪里出错了呢?好的我们先看一下w3shcool里的关于实体的内容:
PCDATA 指的是被解析的字符数据(Parsed Character Data)。
XML 解析器通常会解析 XML 文档中所有的文本。
当某个 XML 元素被解析时,其标签之间的文本也会被解析:
<message>此文本也会被解析</message>
解析器之所以这么做是因为 XML 元素可包含其他元素,就像这个例子中,其中的 <name> 元素包含着另外的两个元素(first 和 last):
<name><first>Bill</first><last>Gates</last></name>
而解析器会把它分解为像这样的子元素:
<name> <first>Bill</first> <last>Gates</last> </name>
非法的 XML 字符必须被替换为实体引用(entity reference)。
假如您在 XML 文档中放置了一个类似 “<” 字符,那么这个文档会产生一个错误,这是因为解析器会把它解释为新元素的开始。因此你不能这样写:
<message>if salary < 1000 then</message>
为了避免此类错误,需要把字符 “<” 替换为实体引用,就像这样:
<message>if salary < 1000 then</message>
下面是xml里5个实体的引用:
注释:严格地讲,在 XML 中仅有字符 “<”和”&” 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。
所以由此我们可以看出,在遇到非法字符的时候我们一定要将字符转义为实体的形式,不然会出现报错的提示。
除了把非法字符转义为实体之外,我们还需要知道另一种方式也可以避免在解析非法字符的时候报错的情况,下面先了解一下:CDATA(Unparsed Character Data),其意思是指不应由XML解析器解析的文本数据。
继续看关于CDATA的说明:
在 XML 元素中,”<” 和 “&” 是非法的。
“<” 会产生错误,因为解析器会把该字符解释为新元素的开始。
“&” 也会产生错误,因为解析器会把该字符解释为字符实体的开始。
某些文本,比如 JavaScript 代码,包含大量 “<” 或 “&” 字符。为了避免错误,可以将脚本代码定义为 CDATA。
CDATA 部分中的所有内容都会被解析器忽略。
CDATA 部分由 “<![CDATA[" 开始,由 "]]>” 结束:
在上面的例子中,解析器会忽略 CDATA 部分中的所有内容。
关于 CDATA 部分的注释:
CDATA 部分不能包含字符串 “]]>”。也不允许嵌套的 CDATA 部分。
标记 CDATA 部分结尾的 “]]>” 不能包含空格或折行。
好了,上面的讲解内容均来自w3school的解释,我在下面关于上面例子中的问题做一下处理,以便更容易理解,在报错的文件做一下小处理:
看上图,这样一来,我们就用CDATA对文本部分做了一下忽略解析,因此中间包含的&非法字符就不会被xml解析器解析到了,所以也就不会报错了。
同理我们可以用转义字符效果也是一样的,“把&替换为&就可以了”问题就很容易解决了!
此文纯为个人遇到的问题,高手请绕行,希望对需要的人有所受用!
发表评论
沙发空缺中,还不快抢~