python 抓取的网页默认是bytes的,要转码
2013-12-27 16:47
169 查看
python 抓取的网页默认是bytes的,要转码.
查看网页源码可以看到,我本次抓取的网页的编码方式是utf-8的.
查看网页源码可以看到,我本次抓取的网页的编码方式是utf-8的.
req = urllib.request.Request(url=myurl,headers = myheaders) data = urllib.request.urlopen(req).read() print(data.decode("UTF-8"))这样就正常显示中文了
相关文章推荐
- 【转】python使用urllib2抓取网页
- 《用python写网络爬虫》--网页抓取方法
- Python2、3 默认字节码以及转码规则
- Python网页抓取urllib,urllib2,httplib[1]
- Python urllib、urllib2、httplib抓取网页代码实例
- (转)如何用python抓取网页并提取数据
- python3 抓取网页资源的 N 种方法
- python 抓取动态网页的问题
- Python抓取网页内容
- 【python】使用HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies
- Python抓取离线网页信息_学习笔记_1
- paip.抓取网页内容--java php python
- Python抓取单个网页中所有的PDF文档
- 使用Python抓取网页图片[转载]
- python抓取网页过程
- Python网页抓取工具Beautiful Soup面面观!
- python——爬虫实现网页信息抓取
- [Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容
- python 示列:抓取网页所有<a>连接
- Python抓取网页&批量下载文件方法初探(正则表达式+BeautifulSoup)