您的位置:首页 > 编程语言 > C语言/C++

C++使用tinyXml读取XML

2013-03-08 09:44 471 查看
最近在开发的过程中,有个需求是对xml进行格式转化,从一种格式转化到另外一种格式。因此,就需要读取xml进行处理。原本打算写成工具在linux下运行,不过后来考虑到和系统结合,最后也就使用了前台js转了。反正都是读取xml,什么技术转不都是一样的么?

不过刚开始还是对要使用的技术做了一定的探究。c++要读取xml有很多种方式.比较又名的有:

rapidXML(这个是网上介绍的,没用过)

Xerces-C++ XML Parser:通常来说,读取XML的方法都是将整个文本进行读取,然后构建成DOM Tree,之后进行遍历等操作。这个Parser除了支持构建DOM Tree的方式之外,还支持类似于回调函数的方式进行处理(SAX,SAX2),在读到相应的节点然后调用函数进行处理。DOM Tree的方式好处是简单,操作很方便,但是劣势也是很明显:需要把整个XML读进之后才能做处理。如果XML很大,那内存就支撑不住了。SAX,SAX2的作用就在此,其可以支持很大的XML,因为其是相当于事件式的处理方式,不需要构建DOM
Tree.不过就是比较麻烦。

TinyXML:这个就是接下来要介绍的库了。取名Tiny,意在编写一个轻量级的处理基本XML的工具。因此,其支持的特性有限。下面列出了其不支持的功能:

TinyXML doesn't parse or use DTDs (Document Type Definitions) or XSLs (eXtensible Stylesheet Language.)                                                           -------------------官方说明文档
其给出的理由也很明确:

1. 支持这两个特性使得库更为庞大

2. 使用更为复杂

3. 学习曲线更曲折

需要使用这些特性的可以考虑上面的xerces-C++ XML Parser,很强大,当然也复杂得多。

TinyXml使用:

前言说的已经够多了,咱们就不废话了,直接讲解tinyXml的使用方法。

安装:

TinyXml的安装方法并不复杂,或者说没有安装这个步骤。

1. 下载tinyXml,下载tinyxml_2_6_2.zip

2. 解压unzip tinyxml_2_6_2.zip。(windows就直接解压就可以了)



对于有vs的朋友来说,直接打开tinyxml.sln就可以了。对于linux用户来说,则需要拷贝上面全出来的6个文件。

PS:顺带的,我觉得可以把它的Makefile也拷出来,写得非常不错,可以参考参考。

使用:

tinyxml的使用方法很简单,只需要把拷出来的文件放在自己编写的目录下面,引用tinyxml.h,tinystr.h即可。

简单示例代码:

View Row Code
1#include
"tinyxml.h"
2#include
"tinystr.h"
3#include <iostream>
4
5using
namespace std;
6int
main(int argc, char
*argv[])
7{
8if(argc
!= 2)
9{
10cout <<
"usage: "<<argv[0]
<<
" xmlfile" << endl;
11return
1;
12}
13TiXmlDocument
doc(argv[1]);
14bool loadOk
= doc.LoadFile();
15if (!loadOk)
16{
17cout <<
"could load:" << doc.ErrorDesc()
<< endl;
18}
19TiXmlPrinter printer;//提供的工具类,目的是将xml的数据按格式输出
20doc.Accept(&printer);
21cout << printer.CStr()
<< endl;//输出
22
23TiXmlElement*node
= doc.FirstChildElement();//获取第一个element节点
24cout << node->Value()
<< endl;//输出节点的值
25string t;
26node->QueryValueAttribute("type",
&t);//获取节点属性
27cout << t
<< endl;
28
29doc.FirstChild()->NextSibling()->ToElement()->QueryStringAttribute("type",
&t);//获取第二个子节点的数据
30cout <<
"2:" << t
<< endl;
31
32//使用遍历的方式进行处理
33TiXmlNode* child
= NULL;
34TiXmlElement* element
= NULL;
35TiXmlAttribute
*attr = NULL;
36int ct;
37while(child
= doc.FirstChild()->IterateChildren(child))
38{
39cout << child->ValueStr()
<<
"\t";
40ct = child->Type();
41cout << ct
<<
"\t";
42//根据不同的节点类型做相应处理
43switch(ct)
44{
45case
TiXmlNode::TINYXML_TEXT:
46break;
47case
TiXmlNode::TINYXML_ELEMENT:
48element = child->ToElement();
49attr = element->FirstAttribute();
50while(attr)
51{
52cout << attr->NameTStr()
<<
"=" << attr->ValueStr()
<<
'\t';
53attr = attr->Next();
54}
55break;
56}
57}
58
59return
0;
60}
编译命令:

View Row Code
1g++
-c tinyxmlparser.cpp -DTIXML_USE_STL
2g++
-c tinyxmlerror.cpp -DTIXML_USE_STL
3g++
-c tinystr.cpp -DTIXML_USE_STL
4g++
-c tinyxml.cpp -DTIXML_USE_STL
5g++
-c xmltest.cpp -DTIXML_USE_STL
6g++
-o xmltest xmltest.o tinyxmlparser.o tinyxmlerror.o tinystr.o tinyxml.o
或者大家可以参考那个Makefile改改。

xml文件:

View Row Code
1<xml>
2<tag1 type='1'/>
3<tag2 type='2'/>
4</xml>
运行结果:

View Row Code
1<xml>
2<tag1 type="1" />
3<tag2 type="2" />
4</xml>
5
6xml
7:
8tag1 1 type=1 tag2 1 type=2
没打回车显得比较混乱,将就这看看。

详细解释:

这部分仅仅是我的理解,可能有错,有错的话还请告知我下。

tinyxml按照xml的规定,将所有结点做了区分,我们也可以看到类库中有:

TiXmlDocument::文档中的根
TiXmlNode: node为文档中所有结点的父类型,其可以转化为其他的结点类型。
TiXmlElement:element结点,即我们平常所使用的,具有属性,tagName的结点。
TiXmlComment:注释
TiXmlText:文字结点。
TiXmlDeclaration:xml的声明(?xml version="1.0" standalone="yes"?>)
TiXmlUnknown:任何tinyXml不认的结点都将归结为unknown,在重新写回文件时,按照原样输出。

一般我们的操作仅仅在于,取tagName,获取属性,获取文字,迭代,这里就讲下这些操作。

tagName:对于element来说,可以使用element->Value()或者element->ValueStr();//两者区别仅仅在于返回值不同,后者返回string。

对于Value()函数来说,文档上也解释了,对于不同的结点,返回值不同。

Document: filename of the xml file

Element: name of the element

Comment: the comment text

Unknown: the tag contents

Text: the text string
获取属性:获取属性有多种方式。最简单的是采用const char* Attrubute(const char *),或者采用QueryValueAttribute (const std::string &name, T *outValue) const。还有获取相应类型,如Int,double等的函数。可以自己查看手册。有时候需要遍历属性时,可以这么写:

View Row Code
1TiXmlAttribute
*attr = NULL;
2attr = element->FirstAttribute();
3while(attr)
4{
5cout << attr->NameTStr()
<<
"=" << attr->ValueStr();
6attr = attr->Next();
7}
获取文字:element->GetText();

迭代:

View Row Code
1TiXmlNode
*child = NULL;
2while(child
= parent->IterateChildren(child))
3{
4cout << child->ValueStr()
<< endl;
5}
总结:

对于TinyXml的介绍大致到这,还有很多细节还没叙述,不过可以看看文档,下的源码包里头就有doc,很方便,讲的也很详细。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: