python技术收集(待继续添加)
2012-08-20 14:49
218 查看
minidom解析非UTF-8编码的xml文件
Python中使用minidom解析xml,会遇到编码问题。minidom支持UTF-8的编码,对于其他的编码,必须进行转换,否则解析时会产生异常。下面以读取gb2312编码的xml文件为例。
sourceFile = codecs.open(sourceFilePath,mode='r')
xmlContentStr = sourceFile.read()
xmlContentStr = xmlContentStr.decode('gb2312').encode('utf-8')
xmlContentStr =xmlContentStr.replace('encoding="gb2312"','encoding="utf-8"')
sourceXML = minidom.parseString(xmlContentStr)
Python中使用minidom解析xml,会遇到编码问题。minidom支持UTF-8的编码,对于其他的编码,必须进行转换,否则解析时会产生异常。下面以读取gb2312编码的xml文件为例。
sourceFile = codecs.open(sourceFilePath,mode='r')
xmlContentStr = sourceFile.read()
xmlContentStr = xmlContentStr.decode('gb2312').encode('utf-8')
xmlContentStr =xmlContentStr.replace('encoding="gb2312"','encoding="utf-8"')
sourceXML = minidom.parseString(xmlContentStr)
相关文章推荐
- Python网络爬虫自动收集51CTO技术文章
- 实用技术网址收集
- 网上收集的“知乎网”技术方案架构
- [置顶] 【python 爬虫】Python爬虫技术分享
- 用python开发股票自动技术分析的软件(三)
- Android无埋点数据收集SDK关键技术
- 在Domoticz中添加彩云天气python插件
- 【python3问题解决】python3代码添加中文注释报错
- Python之向日志输出中添加上下文信息
- python添加噪声
- Python PIL 图片水印添加
- ChinaUnix技术实践之五—Python编程大赛试题和答案
- 【涉及到python的小项目:openCV人脸识别(一)】在csv文件中的每一行信息后面添加数字标签
- 收集了一些python的文章(太牛了)
- SQL Server 常用技术收集
- 好技术文章 收集 陆续编辑中...
- Linux使用笔记4-添加用户变量(设置自己的命令,修改默认python版本等)
- python闭包函数,用装饰器添加认证功能
- T-SQL小收集:为已经存在的表添加唯一约束
- Python一键添加Zabbix监控脚本