您的位置：首页 > Web前端 > Node.js

dom4j简单学习 element和node的区别

2014-02-10 15:43 375 查看

使用dom4j解析处理html时，遇到一些麻烦的问题：

基中必须要使用XPath取得节点，有个命名空间的问题，需要如下处理：

HashMap<String, String> gm = new HashMap<String, String>();

gm.put("xmlns", "http://www.w3.org/1999/xhtml");

Document rootDoc = DocumentHelper.parseText(s);
XPath xpathTable = DocumentHelper
.createXPath("//xmlns:table[@class=\"tableList\"]");
xpathTable.setNamespaceURIs(gm);
List<Node> tables = xpathTable.selectNodes(rootDoc);

现在取出来是Node对象（比如一个table），再往下取时，再用node1.selectNodes会取不到东西，可能还是因为命名空间的麻烦问题，所以最好转为Element，就很容易了，element1.elements("tr")，就可以方便地循环了，比较奇怪的是转换为Element的方法居然是强转-_-!

Element table1 = (Element) tables.get(0); // 第一个表格
由此可以这样理解Node和Element，Node是节点，一个属性、一段文字、一个注释等都是节点，而Element是元素，是比较完整的一个xml的元素，即我们口头上说的xml“结点”（此处故意使用“结”字，以示与“节点”Node区别），呵呵……

dom4j帮助文档在dom4j-1.6.1/docs/guide.html文件里面，全部是英文，但是基本上应该能看懂。

1、四种操作xml的方式:SAX,DOM,JDOM,DOM4J.

2、 DOM(Document Object Model)：意思是把整个xml做为一个整体对象，直接全部放到内存里面，不管xml文件有多大；

3、 SAX=Sample API for XML：假如xml文件有2G，用第一种方式，是很困难的，SAX用的是一种类似流媒体方式进行的。

DOM和SAX是java的API，处理xml文件的时候，相对来说是比较困难的，于是出现了下面两种框架，包装了上面两个框架。

4、 JDOM：

5、 DOM4J：

6、利用DOM4J解析xml文件（读取所有的属性节点）。

Document可以理解为整个文档对象

取root节点。Document.getRootElement()返回的是一个Element（元素）

7、理解运用xpath，path就是路径，xpath在xml文件里面找到特定的节点。

Document.selectNodes(“//hibernate-mapping/class/property”) //其中hibenate-mapping是根节点。做变org.dom4j.Node对象返回的。

Document.selectSingleNodes(“//hibernate-mapping/class/property”)//只拿第一个。

基中@name是property的属性名valueOf是拿出name的值；

需要加入DOM4J里面的jaxen包

8、 DOM4J的生成xml文件

9、用FileWriter生成xml文件的时候，可能没有格式，可以用XMLWriter类，这样自动进行美化。

10、 DOM4J修改xml文件；很少用。

11、自动生成代码往往用的是：freemarker或velocity，这是常用的。用dom4j生成也很少用。

12、怎么用表里面的结构生成xml文件。

13、 JavaDB

a) Properties对象：可以理解为一个表格对应key,value

14、 Databasemetadata，可以能过这个JDK类，读取数据库的表结构，通过这个表结构做一些自己的事情。（熟悉用法）通过JDK文档和google学习

15、元数据就是数据的数据，用来描述数据的数据。

16、 DWR，对Ajax框架封住得比较好，是类和java的结合。

dom4j学习实例：

[java] view
plaincopy

package hb.dom4j;



import java.io.FileWriter;

import java.io.IOException;

import java.util.Iterator;

import java.util.List;



import org.dom4j.Attribute;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.DocumentHelper;

import org.dom4j.Element;

import org.dom4j.Node;

import org.dom4j.io.OutputFormat;

import org.dom4j.io.SAXReader;

import org.dom4j.io.XMLWriter;



public class MyJdomReaderXML {

    public Document parse(String string) throws DocumentException {

        SAXReader reader = new SAXReader();

        Document document = reader.read(string);

        return document;

    }



    public void bar(Document document) throws DocumentException {



        Element root = document.getRootElement();//获得根节点；

        //进行迭代；读取根节点下的所有节点和子节点下的所有节点

        for (Iterator i = root.elementIterator(); i.hasNext();) {

            Element element = (Element) i.next();

            System.out.println(element.getName());

            for (Iterator j = element.elementIterator(); j.hasNext();) {

                System.out.println(((Element) j.next()).getName());

            }

        }



        //读取节点名为foo的所有子节点

        for (Iterator i = root.elementIterator("foo"); i.hasNext();) {

            Element foo = (Element) i.next();

            System.out.println(foo.getName());

        }



        //读取根节点的所有属性

        for (Iterator i = root.attributeIterator(); i.hasNext();) {

            Attribute attribute = (Attribute) i.next();

            System.out.println(attribute.getName());

        }

    }



    /*

     * 可以根据节点名字读取节点，也可以读取节点里的key和value

     */

    public void readNodes(Document document) {

        List list = document.selectNodes( "//foo/bar" );   //foo为根节点，获得根节点下的bar节点

        Node node = document.selectSingleNode( "//foo/bar/author" );  //获得名为author的第一节点

        String name = node.valueOf( "@name" ); //获得节点名属性名为name的value

    }



    /*

     * 如果xml文件很大的情况下，用上面的方法很费时，这样可以用递归遍历整个xml文件

     */

    public void treeWalk(Document document) {

        treeWalk(document.getRootElement());

    }



    /*

     * 递归调用，传递每一个父节点做为参数

     */

    public void treeWalk(Element element) {

        for (int i = 0, size = element.nodeCount(); i < size; i++) {

            Node node = element.node(i);

            if (node instanceof Element) {//如果node实现了Element接口，那么就表示node是一个节点。再递归

                treeWalk((Element) node);

                System.out.println(((Element) node).getName()+":"+node.valueOf("@name"));

            } else {//如果没有实现Element接口，那么就表示这个node不是节点了，输出节点等操作；

            }

        }

    }



    //获得节点属性名key为name的value

    public void findLinks(Document document) throws DocumentException {

        List list = document.selectNodes( "//ehcache/cache/@name" );

        for (Iterator iter = list.iterator(); iter.hasNext(); ) {

            Attribute attribute = (Attribute) iter.next();

            String url = attribute.getValue();

            System.out.println(url);

        }

    }



    /*

     * 创建一个documnet文档

     */

     public Document createDocument() {

            Document document = DocumentHelper.createDocument();

            Element root = document.addElement( "root" );



            Element author1 = root.addElement( "author" )

                .addAttribute( "name", "James" )

                .addAttribute( "location", "UK" )

                .addText( "James Strachan" );



            Element author2 = root.addElement( "author" )

                .addAttribute( "name", "Bob" )

                .addAttribute( "location", "US" )

                .addText( "Bob McWhirter" );

            return document;

        }



     //写入xml文件

     public void write(Document document) throws IOException {



            // lets write to a file

            XMLWriter writer = new XMLWriter(

                new FileWriter( "output.xml" )

            );

            writer.write( document );

            writer.close();





            // Pretty print the document to System.out

            OutputFormat format = OutputFormat.createPrettyPrint();

            writer = new XMLWriter( System.out, format );

            writer.write( document );



            // Compact format to System.out

            format = OutputFormat.createCompactFormat();

            writer = new XMLWriter( System.out, format );

            writer.write( document );

        }



    /*

     * 主函数，用来测试

     */

    public static void main(String[] args) throws DocumentException,

            IOException {

        MyJdomReaderXML mjrx = new MyJdomReaderXML();

        Document d = mjrx.parse("test.xml");

        mjrx.bar(d);

        System.out.println("------one----------");

        mjrx.treeWalk(d);

        System.out.println("------two----------");

        mjrx.findLinks(d);

    }

}

  元素(Element)和结点(Node)有区别，节点包含了元素，元素一定是节点，而必须是含有完整信息的结点才是一个元素。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航