您的位置:首页 > 理论基础 > 计算机网络

简单的Python网络爬虫程序

2016-03-23 20:03 405 查看
<span style="font-size:18px;">import urllib
import httplib2
import urllib.request
import webbrowser

url='http://www.163.com'
content=urllib.request.urlopen(url).read()

open('163.com.html','wb').write(content)

webbrowser.open_new_tab('163.com.html')
webbrowser.open_new_tab('www.baidu.com')</span>
<span style="font-size:18px;">
</span>
<span style="font-size:18px;">上边的代码用来抓取网易首页上的内容,并将抓取到的内容保存在名为163.com.html的html文件中,然后再使用默认的浏览器显示该html文件,</span>
<span style="font-size:18px;">最后使用默认的浏览器打开百度网页。</span>


Python的版本为3.2,Python2中在引用库时只需使用

<span style="font-size:18px;">import urllib
import httplib2
import webbrowser</span>
而无需添加
<span style="font-size:18px;">import urllib.request</span>
并且

<span style="font-size:18px;">content=urllib.request.urlopen(url).read()</span>
应写为

content=urllib.urlopen(url).read()
open('163.com.html','wb').write(content)
应写为

open('163.com.html','w').write(content)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 网络爬虫