您的位置：首页 > 理论基础 > 计算机网络

简单的Python网络爬虫程序

2016-03-23 20:03 405 查看

<span style="font-size:18px;">import urllib
import httplib2
import urllib.request
import webbrowser

url='http://www.163.com'
content=urllib.request.urlopen(url).read()

open('163.com.html','wb').write(content)

webbrowser.open_new_tab('163.com.html')
webbrowser.open_new_tab('www.baidu.com')</span>

<span style="font-size:18px;">
</span>

<span style="font-size:18px;">上边的代码用来抓取网易首页上的内容，并将抓取到的内容保存在名为163.com.html的html文件中，然后再使用默认的浏览器显示该html文件，</span>

<span style="font-size:18px;">最后使用默认的浏览器打开百度网页。</span>

Python的版本为3.2，Python2中在引用库时只需使用

<span style="font-size:18px;">import urllib
import httplib2
import webbrowser</span>

而无需添加

<span style="font-size:18px;">import urllib.request</span>

并且

<span style="font-size:18px;">content=urllib.request.urlopen(url).read()</span>

应写为

content=urllib.urlopen(url).read()

open('163.com.html','wb').write(content)

应写为

open('163.com.html','w').write(content)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： python 网络爬虫

相关文章推荐

新的分享

章节导航