python decode encode unicode 中文乱码 的理解
2014-03-08 12:12
531 查看
查看系统编码
>>> import sys;print sys.getdefaultencoding()
ascii
>>> import sys;print sys.getdefaultencoding()
UTF-8
>>>repr('中文') == '\xe4\xb8\xad\xe6\x96\x87' #执行环境是utf8
>>>repr('中文') =='\xd6\xd0\xce\xc4' #执行环境是asicc
utf8下>>> '中文'.decode('UTF8')
asicc下>>>'中文'.decode('GBK')
结果都是: u'\u4e2d\u6587'(unicode码)
在环境是asicc下看到中文必须是u'\u4e2d\u6587'.encode('GBK'或'gb2312' 或'gb18030')
如果 utf8下对unicode码使用gbk 看到是乱码
如果 asicc下对unicode码使用utf8 看到是乱码
使用print unicode的时候,会自动使用encode('系统编码进行')
可以看到
转成unicode
#执行环境是utf8
>>>b = '中文'.decode('utf-8')
>>>c = unicode ('中文', 'utf-8')
>>>d = u'中文'
>>>e = ''\xe4\xb8\xad\xe6\x96\x87''.decode(''utf-8)
#执行环境是asicc
>>>bb = '中文'.decode('GBK')
>>>cc = unicode ('中文', 'GBK')
>>>dd = '\xd6\xd0\xce\xc4'.decode('GBK')
结果都一样
>>> import sys;print sys.getdefaultencoding()
ascii
>>> import sys;print sys.getdefaultencoding()
UTF-8
>>>repr('中文') == '\xe4\xb8\xad\xe6\x96\x87' #执行环境是utf8
>>>repr('中文') =='\xd6\xd0\xce\xc4' #执行环境是asicc
utf8下>>> '中文'.decode('UTF8')
asicc下>>>'中文'.decode('GBK')
结果都是: u'\u4e2d\u6587'(unicode码)
在环境是asicc下看到中文必须是u'\u4e2d\u6587'.encode('GBK'或'gb2312' 或'gb18030')
如果 utf8下对unicode码使用gbk 看到是乱码
如果 asicc下对unicode码使用utf8 看到是乱码
使用print unicode的时候,会自动使用encode('系统编码进行')
可以看到
转成unicode
#执行环境是utf8
>>>b = '中文'.decode('utf-8')
>>>c = unicode ('中文', 'utf-8')
>>>d = u'中文'
>>>e = ''\xe4\xb8\xad\xe6\x96\x87''.decode(''utf-8)
#执行环境是asicc
>>>bb = '中文'.decode('GBK')
>>>cc = unicode ('中文', 'GBK')
>>>dd = '\xd6\xd0\xce\xc4'.decode('GBK')
结果都一样
相关文章推荐
- 【python】python新手必碰到的问题---encode与decode,中文乱码[转]
- 【python】python新手必碰到的问题---encode与decode,中文乱码[转]
- python中文字符编码decode,encode以及乱码解决总结
- Python 中的 encode 和 decode 以及如何避免中文乱码
- 解决vs2013下创建的python文件,到其他平台(如linux)下中文乱码(或运行时报SyntaxError: (unicode error) 'utf-8' codec can't decode byte...)
- python新手必碰到的问题---encode与decode,中文乱码
- python新手必碰到的问题---encode与decode,中文乱码
- [转]python新手必碰到的问题---encode与decode,中文乱码
- python基础-encode与decode,中文乱码
- python新手必碰到的问题---encode与decode,中文乱码
- UnicodeEncodeError: 'latin-1' codec can't encode characters,python3 中文乱码
- python新手必碰到的问题---encode与decode,中文乱码,for 循环 in判断中文
- 【python】python新手必碰到的问题---encode与decode,中文乱码[转]
- python新手必碰到的问题---encode与decode,中文乱码
- 数据库乱码问题 & Python 编码问题(Unicode 的 encode、decode 相互转换 )
- python新手必碰到的问题---encode与decode,中文乱码
- [转]python新手必碰到的问题---encode与decode,中文乱码--转载
- 数据库乱码问题 & Python 编码问题(Unicode 的 encode、decode 相互转换 )
- python新手必碰到的问题---encode与decode,中文乱码[转]
- python新手必碰到的问题---encode与decode,中文乱码