python urllib中的编码处理示例
2018-10-12 13:53
716 查看
>>> import urllib
>>> data = '丽江'
>>> print data
丽江
>>> data
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> urllib.quote(data)
'%E4%B8%BD%E6%B1%9F'
那我们想转回去呢?
>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
丽江
不同的编码格式对urllib的结果页是有影响的,百度的是gbk,其他的一般网站比如google就是utf8的。所以可以用下列语句实现。
>>> import sys,urllib
>>> s = '丽江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>
这里的 sys.stdin.encoding 是读取当前环境的编码,这样写的话可移植性高,winnt和xunix都可以用。当然你如果看不惯,也可以替换为自己的环境编码如utf8等。
您可能感兴趣的文章:
相关文章推荐
- Python urllib2.urlopen打开中文url的编码处理_Luffy's Space_百度空间
- python处理中文编码和判断编码示例
- python处理中文编码和判断编码示例
- python urllib2 处理编码的两个注意点
- 【转】Python urllib2.urlopen打开中文url的编码处理
- python 学习之Windows 下的编码处理!
- python对于中文编码处理的几种方式
- Python的编码处理技术
- python处理不同编码格式的文件
- python中读写文件及中文编码处理方法【整理】
- Python处理JSON时的值报错及编码报错的两则解决实录
- Python urllib2 设置超时时间并处理超时异常
- python通过urllib2爬网页上种子下载示例
- 通过读写文本文件小结“关于python处理中文编码的问题”
- 也谈 Python 的中文编码处理
- 浅谈Python爬取网页的编码处理
- python处理url中的中文编码,以及其他编码问题
- (转载) 浅谈python编码处理
- python与sqlite处理中文字符时出现的编码错误问题解决
- 03—小白学Python爬虫之urllib的基本和进阶使用及Get、Post示例