您的位置：首页 > 编程语言 > Java开发

java读取xml配置文件

2009-08-13 18:19 579 查看

使
用DOM解析XML文档时，需要读入整个XML文档，然后在内存中创建DOM树，生成DOM树上的每个节点对象。只有在整个DOM树创建完毕后，
我们才能做其他的操作，即使我们只需要修改根元素节点的第二个子节点，仍然需要在进行这个小小的修改之间分析整个文档，在内存中构建文档树。当XML文档
比较大时，构建DOM树将花费大量的时间和内存。

一种替代的技术就是使用SAX，SAX允许你在读取文档的时候，即对它进行处理，解析完毕处理也就完成了，不必等待整个文档被分析存储之后才进行操作。

三步过程

为了使用 XML 文件中的信息，必须解析文件以创建一个 Document 对象。

Document 对象是一个接口(??为了统一吗
)，因而不能直接将它实例化；一般情况下，应用程序会相应使用一个工厂。准确的过程因实现而异，但是基本思想是相同的。（同样，Level 3
标准化了这个任务。）在这个例子 Java 环境中，解析文件是一个三步过程：

1.创建 DocumentBuilderFactory。 DocumentBuilderFactory 对象创建 DocumentBuilder。

2.创建 DocumentBuilder。 DocumentBuilder 执行实际的解析以创建 Document 对象。

3.解析文件以创建 Document 对象。

现在您可以开始构建应用程序了。

基本的应用程序

首先创建一个基本的应用程序，即一个名为 OrderProcessor 的类。

『『『『

第一步是生成一个DocumentBuilderFactory对象，newInstance()是静态方法，所以可以直接类名点调用。

第二步是用工厂生成一个DocumentBuilder对象，但是newDocumentBuilder()是抽象方法，还没实现，在这里就可以调用了吗？还是像你以前说的，只要能产生一个抽象类的对象，那么这个抽象类的所以抽象方法就都已经实现了？是这样吗

newDocumentBuilder()抽象方法肯定会被非抽象子类实现，这就发生了多态，执行时调用子类的重写后的方法

view plaincopy to clipboardprint?

public class DocumentBuilderFactoryImpl extends DocumentBuilderFactory {

......................

}

sun的newInstance()方法

public static DocumentBuilderFactory newInstance() {

try {

return (DocumentBuilderFactory) FactoryFinder.find(

/* The default property name according to the JAXP spec */

"javax.xml.parsers.DocumentBuilderFactory",

/* The fallback implementation class name */

"com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl");

} catch (FactoryFinder.ConfigurationError e) {

throw new FactoryConfigurationError(e.getException(),

e.getMessage());

}

}

它应该是用反射返回了一个DocumentBuilderFactoryImpl的实例，然后用DocumentBuilderFactory强
转，也就是：DocumentBuilderFactory.newInstance()返回一个Object类型的
DocumentBuilderFactory实例，下面的就不用说了吧！

』

view plaincopy to clipboardprint?

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import java.io.File;

import org.w3c.dom.Document;

public class OrderProcessor {

public static void main (String args[]) {

File docFile = new File("orders.xml");

Document doc = null;

try {

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

DocumentBuilder db = dbf.newDocumentBuilder();

doc = db.parse(docFile);

} catch (Exception e) {

System.out.print("Problem parsing the file: "+e.getMessage());

}

}

}

首先，Java 代码导入必要的类，然后它创建 OrderProcessor 应用程序。本教程中的例子仅处理一个文件，因此为简洁起见，应用程序包含了对该文件的直接引用。

因此 Document 对象可以在以后使用，应用程序把它定义在 try-catch 块之外。

在 try-catch 块中，应用程序创建了 DocumentBuilderFactory，然后再使用它来创建 DocumentBuilder。最后，DocumentBuilder 解析文件以创建 Document。

解析器设置

使用 DocumentBuilder 创建解析器的优点之一在于能够控制 DocumentBuilderFactory 创建的解析器上的各种设置。例如，可以设置解析器验证文档：

try {

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

dbf.setValidating(true);

DocumentBuilder db = dbf.newDocumentBuilder();

doc = db.parse(docFile);

} catch (Exception e) {

...

Java 的 DOM Level 2 实现允许通过以下方法控制解析器的参数：

setCoalescing()：决定解析器是否要将 CDATA 节点转换为文本，以及是否要和周围的文本节点合并（如果适用的话）。其默认值为 false。

setExpandEntityReferences()：确定是否要展开外部实体引用。如果为 true，外部数据将插入文档。其默认值为 true。（请参阅参考资料以了解关于使用外部实体的技巧。）

setIgnoringComments()：确定是否要忽略文件中的注释。其默认值为 false。

setIgnoringElementContentWhitespace()：确定是否要忽略元素内容中的空白（类似于浏览器对待 HTML 的方式）。其默认值为 false。

setNamespaceAware()：确定解析器是否要注意名称空间信息。其默认值为 false。

setValidating()：默认情况下，解析器不验证文档。将这个参数设置为 true 可打开验证功能。

W3C DOM

文档对象模型(DOM)是与平台和语言无关的接口，允许程序和脚本动态地访问和更新文档的内容，结构和样式。文档可以进一步处理，处理的结果可以放回到所提供的页面中。

表3-1 用于处理XML文档的DOM元素属性

属性名

描述

childNodes

返回当前元素所有子元素的数组

firstChild

返回当前元素的第一个下级子元素

lastChild

返回当前元素的最后一个子元素

nextSibling

返回紧跟在当前元素后面的元素

nodeValue

指定表示元素值的读/写属性

parentNode

返回元素的父节点

previousSibling

返回紧邻当前元素之前的元素

表3-2 用于遍历XML文档的DOM元素方法

方法名

描述

getElementById(id) (document)

获取有指定唯一ID属性值文档中的元素

getElementsByTagName(name)

返回当前元素中有指定标记名的子元素的数组

hasChildNodes()

返回一个布尔值，指示元素是否有子元素

getAttribute(name)

返回元素的属性值，属性由name指定

表3-3 动态创建内容时所用的W3C DOM属性和方法

属性/方法

描述

document.createElement(tagName)

文档对象上的createElement方法可以创建由tagName指定的元素。如果以串div作为方法参数，就会生成一个div元素

Document.createTextNode(text)

文档对象的createTextNode方法会创建一个包含静态文本的节点

<element>.appendChild(childNode)

appendChild方法将指定的节点增加到当前元素的子节点列表。例如，可以增加一个option元素，作为select元素的子节点。

<element>.getAttribute(name)

这些方法分别获得和设置元素中name属性的值

<element>.setAttribute(name,value)

<element>.insertBefore(newNode,targetNode)

这个方法将节点newNode作为当前元素的子节点插到targetNode元素前面

<element>.removeAttribute(name)

这个方法从元素中删除属性name

<element>.removeChild(childNode)

这个方法从元素中删除子childNode

<element>.replaceChild(newNode,oldNode)

这个方法将节点oldNode替换为节点newNode

<element>.hasChildNodes()

这个方法返回一个布尔值，指示元素是否有子元素

Java和XML是黄金组合，网上已经有很多文章介绍，XML作为电子商务中数据交换，已经有其不可替代的作用，但是在平时系统开发中，我们不一定都用到数据交换，是不是无法使用XML了？

当然不是，现在已经有一个新趋势，Java程序的配置文件都开始使用XML格式，以前是使用类似windows的INI格式。（Java中也有
Propertiesy这样的类专门处理这样的属性配置文件）。使用XML作为Java的配置文件有很多好处，从Tomcat的安装配置文件和J2ee的
配置文件中，我们已经看到XML的普遍应用，让我们也跟随流行趋势用XML武装起来。

现在关键是如何读取XML配置文件？有好几种XML解析器：主要有DOM和SAX ，这些区别网上文章介绍很多。

在apache的XML项目组中，目前有Xerces Xalan Cocoon几个开发XML相关技术的project.Tomcat本身使用的是 Sun 的 JAXP，而其XSL Taglib project中使用Xerces解析器。

好了，上面都是比较烦人的理论问题，还是赶快切入XML的配置文件的读取吧。

在我们的程序中，通常要有一些根据主机环境确定的变量。比如数据库访问用户名和密码，不同的主机可能设置不一样。只要更改XML配置文件，就可以正常运行。 localhost

sqlname

username

password

上面这个myenv.xml配置文件一般是放在tomcat的WEB-INF/classes目录下。

我们编制一个Java程序直接读取,将dbhost dbuser dbpassword提取出来供其他程序访问数据库用。

目前使用SAX比较的多,与DOM主要区别是
SAX是一行一行读取XML文件进行分析,适合比较大文件,DOM是一次性读入内存,显然不能对付大文件.这里我们使用SAX解析,由于SAX解析器不断
在发展,网上有不少文章是针对老版本的.如果你使用JDK1.4
,可以参考使用SAX处理XML文档一文.这里的程序是根据其改进并且经过实践调试得来的.。

view plaincopy to clipboardprint?

import org.xml.sax.Attributes;

import org.xml.sax.helpers.DefaultHandler;

import org.xml.sax.SAXException;

import java.util.Properties;

//使用DefaultHandler的好处是不必陈列出所有方法,

public class ConfigParser extends DefaultHandler {

////定义一个Properties 用来存放 dbhost dbuser dbpassword的值

private Properties props;

private String currentSet;

private String currentName;

private StringBuffer currentValue = new StringBuffer();

//构建器初始化props

public ConfigParser() {

this.props = new Properties();

}

public Properties getProps() {

return this.props;

}

//定义开始解析元素的方法. 这里是将中的名称xxx提取出来.

public void startElement(String uri, String localName, String qName, Attributes attributes)

throws SAXException {

currentValue.delete(0, currentValue.length());

this.currentName =qName;

}

//这里是将之间的值加入到currentValue

public void characters(char[] ch, int start, int length) throws SAXException {

currentValue.append(ch, start, length);

}

//在遇到结束后,将之前的名称和值一一对应保存在props中

public void endElement(String uri, String localName, String qName) throws SAXException {

props.put(qName.toLowerCase(), currentValue.toString().trim());

}

}

上面的这个解析程序比较简单吧? 其实解析XML就是这么简单。

现在我们已经将dbhost dbuser dbpassword的值localhost sqlname username password提取了出来.但是这只是在在解析器内部,我们的程序还不能访问.需要再编制一个程序。

view plaincopy to clipboardprint?

import java.util.Properties;

import javax.xml.parsers.SAXParser;

import javax.xml.parsers.SAXParserFactory;

import java.net.URL;

public class ParseXML{

//定义一个Properties 用来存放 dbhost dbuser dbpassword的值

private Properties props;

//这里的props

public Properties getProps() {

return this.props;

}

public void parse(String filename) throws Exception {

//将我们的解析器对象化

ConfigParser handler = new ConfigParser();

//获取SAX工厂对象

SAXParserFactory factory = SAXParserFactory.newInstance();

factory.setNamespaceAware(false);

factory.setValidating(false);

//获取SAX解析

SAXParser parser = factory.newSAXParser();

//得到配置文件myenv.xml所在目录. tomcat中是在WEB-INF/classes

//下例中BeansConstants是用来存放xml文件中配置信息的类,可以自己代替或定义

URL confURL = BeansConstants.class.getClassLoader().getResource(filename);

try

{

//将解析器和解析对象myenv.xml联系起来,开始解析

parser.parse(confURL.toString(), handler);

//获取解析成功后的属性以后我们其他应用程序只要调用本程序的props就可以提取出属性名称和值了

props = handler.getProps();

}finally{

factory=null;

parser=null;

handler=null;

}

}

}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航