一段简单的 Python 爬虫程序
2013-12-24 00:00
155 查看
一段简单的 Python 爬虫程序,用来练习挺不错的。
#读出一个URL下的a标签里href地址为.html的所有地址
一段简单的 Python 爬虫程序,用来练习挺不错的。
#读出一个URL下的a标签里href地址为.html的所有地址
#!/usr/bin/python
# Filename: test.py
import urllib
content = urllib.urlopen('http://codecloud.net').read()
s1 = 0
while s1 >= 0:
begin = content.find(r'<a',s1)
m1 = content.find(r'href=',begin)
m2 = content.find(r'>',m1)
if(content[m1:m2].find(r'.html')!=-1):
m2 = content.find(r'.html',m1)
url = content[m1+6:m2+5]
print url
s1 = m2
#读出一个URL下的a标签里href地址为.html的所有地址
一段简单的 Python 爬虫程序,用来练习挺不错的。
#读出一个URL下的a标签里href地址为.html的所有地址
#!/usr/bin/python
# Filename: test.py
import urllib
content = urllib.urlopen('http://codecloud.net').read()
s1 = 0
while s1 >= 0:
begin = content.find(r'<a',s1)
m1 = content.find(r'href=',begin)
m2 = content.find(r'>',m1)
if(content[m1:m2].find(r'.html')!=-1):
m2 = content.find(r'.html',m1)
url = content[m1+6:m2+5]
print url
s1 = m2
相关文章推荐
- 用 python 做简单的网页爬虫程序
- linux下用python写简单的爬虫程序
- 用 python 做简单的网页爬虫程序
- python简单的爬虫程序
- 简单的Python爬虫程序
- Python 学习(6)---简单的网页爬虫程序
- 一个简单的python爬虫程序
- 史上最简单的爬虫小程序(Python)
- 一个简单的python爬虫程序
- 学习一段python简单备份程序
- python简单爬虫程序
- python简单网络爬虫程序
- 简单的Python爬虫刷访问量程序
- python-08:理解最简单的爬虫程序
- 一个简单的爬虫程序(爬取百度百科关于python的一千个页面)
- 一个简单的python爬虫程序 爬取豆瓣热度Top100以内的电影信息
- Python 简单爬虫程序 以及 urllib.urlretrieve()方法 改变文件存放文件位置
- python-07:最简单的爬虫程序
- python写的的简单的爬虫小程序
- python:第一个简单爬虫程序