[Java开发之路](11)SAX解析XML文档
2016-01-03 13:02
661 查看
1.简介
Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档;
SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档;
SAX采用事件驱动的方式解析XML。套用网友的解释:如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息。SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理。在SAX的解析过程中,读取到文档开头、文档结尾,元素的开头和元素结尾都会调用相应方法,我们可以在这些方法中进行相应事件处理。
对应方法:
我们还需一个方法来处理元素节点中间的文本节点(我们常误以为元素节点的文本值)
2.解析
解析步骤:
(1)通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory
(2)通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser
(3)创建一个类继承DefaultHandler,重写其中的一些方法进行业务处理
(4)创建Handler类对象实例
(5)解析XML文档
以下代码均使用本XML文档:
[/code]
3.具体实例:
运行结果:
4.解析并储存于对象中
运行结果:
Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档;
SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档;
SAX采用事件驱动的方式解析XML。套用网友的解释:如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息。SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理。在SAX的解析过程中,读取到文档开头、文档结尾,元素的开头和元素结尾都会调用相应方法,我们可以在这些方法中进行相应事件处理。
对应方法:
[code]publicvoidstartDocument()throwsSAXException{
}
publicvoidendDocument()throwsSAXException{
}
publicvoidstartElement(Stringuri,StringlocalName,StringqName,Attributesattributes)throwsSAXException{
}
publicvoidendElement(Stringuri,StringlocalName,StringqName)throwsSAXException{
}
我们还需一个方法来处理元素节点中间的文本节点(我们常误以为元素节点的文本值)
[code]publicvoidcharacters(char[]ch,intstart,intlength)throwsSAXException{
}
2.解析
解析步骤:
(1)通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory
[code]SAXParserFactoryfactory=SAXParserFactory.newInstance();
(2)通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser
[code]SAXParserparser=factory.newSAXParser();
(3)创建一个类继承DefaultHandler,重写其中的一些方法进行业务处理
[code]packagecom.qunar.handler;
importorg.xml.sax.Attributes;
importorg.xml.sax.SAXException;
importorg.xml.sax.helpers.DefaultHandler;
publicclassSAXParserHandlerextendsDefaultHandler{
//用来标示解析开始
@Override
publicvoidstartDocument()throwsSAXException{
}
//用来标示解析结束
@Override
publicvoidendDocument()throwsSAXException{
}
//用来遍历XML文件的开始标签
@Override
publicvoidstartElement(Stringuri,StringlocalName,StringqName,Attributesattributes)throwsSAXException{
super.startElement(uri,localName,qName,attributes);
}
//用来遍历XML文件的结束标签
@Override
publicvoidendElement(Stringuri,StringlocalName,StringqName)throwsSAXException{
super.endElement(uri,localName,qName);
}
@Override
publicvoidcharacters(char[]ch,intstart,intlength)throwsSAXException{
super.characters(ch,start,length);
}
}
(4)创建Handler类对象实例
[code]//定义SAXParserHandler对象
SAXParserHandlerhandler=newSAXParserHandler();
(5)解析XML文档
[code]saxParser.parse(path,handler);
以下代码均使用本XML文档:
[code]<?xmlversion="1.0"encoding="utf-8"?><bookstore>
<bookcategory="Java">
<titlelang="chi">Java多线程编程核心技术</title>
<author>高洪岩</author>
<year>2015</year>
<price>69.00</price>
</book>
<bookcategory="C++">
<titlelang="en">EffectiveC++:55SpecificWaystoImproveYourProgramsandDesigns</title>
<author>ScottMeyers</author>
<year>2006</year>
<price>58.00</price>
</book>
<bookcategory="Web">
<titlelang="en">LearningXML</title>
<author>ErikT.Ray</author>
<year>2016</year>
<price>39.95</price>
</book>
</bookstore>
[/code]
3.具体实例:
[code]packagecom.qunar.handler;
importorg.xml.sax.Attributes;
importorg.xml.sax.SAXException;
importorg.xml.sax.helpers.DefaultHandler;
publicclassSAXParserHandlerextendsDefaultHandler{
privateintbookIndex=0;
//用来标示解析开始
@Override
publicvoidstartDocument()throwsSAXException{
System.out.println("SAX解析开始...");
}
//用来标示解析结束
@Override
publicvoidendDocument()throwsSAXException{
System.out.println("SAX解析结束...");
}
//用来遍历XML文件的开始标签
@Override
publicvoidstartElement(Stringuri,StringlocalName,StringqName,Attributesattributes)throwsSAXException{
//调用DefaultHandler类的startElement方法
super.startElement(uri,localName,qName,attributes);
//开始解析book元素节点
if(qName.equals("book")){
++bookIndex;
System.out.println("开始解析第"+bookIndex+"本书...");
//已知book元素节点下的属性名称,根据属性名称获取属性值
/*Stringvalue=attributes.getValue("category");
System.out.println("value->"+value);*/
//不知道book元素节点下的属性名称以及个数
intsize=attributes.getLength();
for(inti=0;i<size;++i){
System.out.println(attributes.getQName(i)+":"+attributes.getValue(i));
}//for
}//if
elseif(!qName.equals("bookstore")){
System.out.print(qName+":");
}//else
}
//用来遍历XML文件的结束标签
@Override
publicvoidendElement(Stringuri,StringlocalName,StringqName)throwsSAXException{
super.endElement(uri,localName,qName);
//判断一本书是否解析完
if(qName.equals("book")){
System.out.println("结束解析第"+bookIndex+"本书...");
}//if
}
@Override
publicvoidcharacters(char[]ch,intstart,intlength)throwsSAXException{
super.characters(ch,start,length);
Stringtext=newString(ch,start,length);
if(!text.trim().equals("")){
System.out.println(text);
}//if
}
}
[code]packagecom.qunar.xml;
importjava.io.IOException;
importjavax.xml.parsers.ParserConfigurationException;
importjavax.xml.parsers.SAXParser;
importjavax.xml.parsers.SAXParserFactory;
importorg.xml.sax.SAXException;
importcom.qunar.handler.SAXParserHandler;
/**
*SAX方式解析XML文档
*@authorsjf0115
*
*/
publicclassSAXXMLCode{
publicstaticvoidmain(String[]args){
Stringpath="D:\\bookstore.xml";
try{
//通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory
SAXParserFactoryfactory=SAXParserFactory.newInstance();
//通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser
SAXParsersaxParser=factory.newSAXParser();
//定义SAXParserHandler对象
SAXParserHandlerhandler=newSAXParserHandler();
//解析XML文档
saxParser.parse(path,handler);
}catch(ParserConfigurationExceptione){
e.printStackTrace();
}catch(SAXExceptione){
e.printStackTrace();
}catch(IOExceptione){
e.printStackTrace();
}
}
}
运行结果:
SAX解析开始... 开始解析第1本书... category:Java title:Java多线程编程核心技术 author:高洪岩 year:2015 price:69.00 结束解析第1本书... 开始解析第2本书... category:C++ title:EffectiveC++:55SpecificWaystoImproveYourProgramsandDesigns author:ScottMeyers year:2006 price:58.00 结束解析第2本书... 开始解析第3本书... category:Web title:LearningXML author:ErikT.Ray year:2016 price:39.95 结束解析第3本书... SAX解析结束... |
[code]packagecom.qunar.bean;
/**
*book实体类
*@authorsjf0115
*
*/
publicclassBook{
privateStringcategory;
privateStringtitle;
privateStringauthor;
privateStringyear;
privateStringprice;
privateStringlang;
publicStringgetCategory(){
returncategory;
}
publicvoidsetCategory(Stringcategory){
this.category=category;
}
publicStringgetTitle(){
returntitle;
}
publicvoidsetTitle(Stringtitle){
this.title=title;
}
publicStringgetAuthor(){
returnauthor;
}
publicvoidsetAuthor(Stringauthor){
this.author=author;
}
publicStringgetYear(){
returnyear;
}
publicvoidsetYear(Stringyear){
this.year=year;
}
publicStringgetPrice(){
returnprice;
}
publicvoidsetPrice(Stringprice){
this.price=price;
}
publicStringgetLang(){
returnlang;
}
publicvoidsetLang(Stringlang){
this.lang=lang;
}
@Override
publicStringtoString(){
return"category:"+category+"lang:"+lang+"title:"+title+"author:"+author+"year:"+year+"price:"+price;
}
}
[code]packagecom.qunar.handler;
importjava.util.ArrayList;
importjava.util.List;
importorg.xml.sax.Attributes;
importorg.xml.sax.SAXException;
importorg.xml.sax.helpers.DefaultHandler;
importcom.qunar.bean.Book;
publicclassSAXParserHandlerextendsDefaultHandler{
privateBookbook;
privateintbookIndex=0;
//节点文本内容
privateStringtext;
privateList<Book>bookList=newArrayList<Book>();
publicList<Book>getBookList(){
returnbookList;
}
//用来标示解析开始
@Override
publicvoidstartDocument()throwsSAXException{
System.out.println("SAX解析开始...");
}
//用来标示解析结束
@Override
publicvoidendDocument()throwsSAXException{
System.out.println("SAX解析结束...");
}
//用来遍历XML文件的开始标签
@Override
publicvoidstartElement(Stringuri,StringlocalName,StringqName,Attributesattributes)throwsSAXException{
//调用DefaultHandler类的startElement方法
super.startElement(uri,localName,qName,attributes);
//开始解析book元素节点
if(qName.equals("book")){
//创建一个book对象
book=newBook();
++bookIndex;
System.out.println("开始解析第"+bookIndex+"本书...");
intsize=attributes.getLength();
for(inti=0;i<size;++i){
Stringattr=attributes.getQName(i);
//属性category
if(attr.equals("category")){
book.setCategory(attributes.getValue(i));
}//if
}//for
}//if
//用于遍历title节点中的属性
elseif(qName.equals("title")){
intsize=attributes.getLength();
for(inti=0;i<size;++i){
Stringattr=attributes.getQName(i);
//属性category
if(attr.equals("lang")){
book.setLang(attributes.getValue(i));
}//if
}//for
}//else
}
//用来遍历XML文件的结束标签
@Override
publicvoidendElement(Stringuri,StringlocalName,StringqName)throwsSAXException{
super.endElement(uri,localName,qName);
//判断一本书是否解析完
if(qName.equals("book")){
bookList.add(book);
book=null;
System.out.println("结束解析第"+bookIndex+"本书...");
}//if
elseif(qName.equals("title")){
book.setTitle(text);
}//else
elseif(qName.equals("author")){
book.setAuthor(text);
}//else
elseif(qName.equals("year")){
book.setYear(text);
}//else
elseif(qName.equals("price")){
book.setPrice(text);
}//else
}
//文本值
@Override
publicvoidcharacters(char[]ch,intstart,intlength)throwsSAXException{
super.characters(ch,start,length);
text=newString(ch,start,length);
}
}
[code]packagecom.qunar.xml;
importjava.io.IOException;
importjava.util.List;
importjavax.xml.parsers.ParserConfigurationException;
importjavax.xml.parsers.SAXParser;
importjavax.xml.parsers.SAXParserFactory;
importorg.xml.sax.SAXException;
importcom.qunar.bean.Book;
importcom.qunar.handler.SAXParserHandler;
/**
*SAX方式解析XML文档
*@authorsjf0115
*
*/
publicclassSAXXMLCode{
publicstaticvoidmain(String[]args){
Stringpath="D:\\bookstore.xml";
try{
//通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory
SAXParserFactoryfactory=SAXParserFactory.newInstance();
//通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser
SAXParsersaxParser=factory.newSAXParser();
//定义SAXParserHandler对象
SAXParserHandlerhandler=newSAXParserHandler();
//解析XML文档
saxParser.parse(path,handler);
//得到遍历结果
List<Book>bookList=handler.getBookList();
System.out.println("遍历结果:");
for(Bookbook:bookList){
System.out.println(book);
}//for
}catch(ParserConfigurationExceptione){
e.printStackTrace();
}catch(SAXExceptione){
e.printStackTrace();
}catch(IOExceptione){
e.printStackTrace();
}
}
}
运行结果:
SAX解析开始... 开始解析第1本书... 结束解析第1本书... 开始解析第2本书... 结束解析第2本书... 开始解析第3本书... 结束解析第3本书... SAX解析结束... 遍历结果: category:Javalang:chititle:Java多线程编程核心技术author:高洪岩year:2015price:69.00 category:C++lang:entitle:EffectiveC++:55SpecificWaystoImproveYourProgramsandDesignsauthor:ScottMeyersyear:2006price:58.00 category:Weblang:entitle:LearningXMLauthor:ErikT.Rayyear:2016price:39.95 |
相关文章推荐
- Struts2学习第二章
- Java中的类加载器
- Java 开发 Unable to execute dex 问题解决记录
- myeclipse安装git插件
- eclipse 配置 wildfly
- Struts2的学习第一章
- Java 代码删除文件夹及其子文件夹和文件操作
- Java 实现下载
- Java 中 Comparable 和 Comparator 比较(转)
- Spring中bean的作用域
- Eclipse安装svn插件(安装Subversion1.12.x(SVN)插件)
- java中的集合框架
- 【Java EE 学习 82 上】【MAVEN基本安装和使用方法】
- java web学习(基础篇)二 走进JSP
- 【LWJGL2 WIKI】【基础篇】基础5:全屏
- 参与 Spring 4 中文文档翻译
- java基础巩固练习(二)
- myEclipse 注册码 在线生成
- nohup启动java命令导致dubbo无法注册
- Fastdfs-javaapi-连接池