您的位置:首页 > 编程语言 > Java开发

java 解析 xml 文档

2012-05-18 13:33 288 查看
为读取和分析xml文档的内容,需要一个xml解析器。解析器是读取文档,检查其语法是否正确并在它除了文档时完成某些工作的程序。有两种xml解析器是经常使用的。一种遵循称为SAX (xml简单api)规范,另一种遵循称为dom 规范。sax解析器是事件驱动的。只要解析器遇到某种结构(例如,开始标签<price> ),它就会调用必须提供的一个方法。相反,dom解析器则构建表示被解析文档的树。一旦解析器建树完毕,就可以分析此树。对需要大量内存来处理树结构的大型xml来说,sax解析器的效率更高。但是,对大多数应用程序来说,dom解析器更容易使用--解析树给出了数据的完成概况,而sax解析器只给出零散的信息。

在sax解析器分析文档时,会激活事件,而dom解析器则构建文档树。

Document接口描述xml文档的树结构,为了生成实现Document接口类的对象,就需要一个DocumentBuilder对象,为了得到DocumentBuilder,首先调用DocumentBuilderFactory类的静态方法newInstance方法,然后在工厂对象上调用newDocumenBuilder方法。

File f=new File(" ");
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc = builder.parse(f);


DocumentBuilder能够从文件,url或者输入流中读取xml文件,其结果是包含数的Document对象。

如果文档位于Internet上,就使用URL;

URL url=new URL(urlname);

也可以从任意输入流中读取文档:

InputStream in=......;

Document doc=builder.parse(in);

一旦创建了新文档或从文件中读取了文档,就可以检查并修改它。

下面是一份简单的xml文档,no是车牌号码,addr是车主地址:

<?xml version="1.0" encoding="GB2312"?>
<result>
<value>
<no>A123</no>
<addr>广东省珠海市香洲区</addr>
</value>

<value>
<no>b456 </no>
<addr>北京市朝阳区</addr>
</value>

</result>


用dom解析程序如下:

package dom;

import javax.xml.parsers.*;

import org.w3c.dom.*;

import java.io.*;
import java.util.*;
public class MyXMLReader{
public static void main(String arge[]){

long lasting =System.currentTimeMillis();
try{
File f=new File("resource/data_10k.xml");
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc = builder.parse(f);
NodeList nl = doc.getElementsByTagName("value");

for (int i=0;i<nl.getLength();i++)

{
System.out.print("车牌号码:" + doc.getElementsByTagName("no").item(i).getFirstChild().getNodeValue());
System.out.println("车主地址:" + doc.getElementsByTagName("addr").item(i).getFirstChild().getNodeValue());

}

}catch(Exception e){
e.printStackTrace();
}
}
}


注意 import javax.swing.text.Document;包中也有一个Document类,不要导入这个包,应导入import org.w3c.dom.Document;这个包

输出:

车牌号码:A123车主地址:广东省珠海市香洲区
车牌号码:b456 车主地址:北京市朝阳区
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: