【Python编程】读取网页内容并存储过滤
2014-02-25 14:44
393 查看
import urllib2
import re
url = 'http://192.168.1.170:8000'
content = urllib2.urlopen(url).read()
file = open('results.txt','w')
file.write(str(content))
file.close
pattern1 = re.findall(r'alert\(\"(.*)\"\)',content)
for i in pattern1:
print i
print 'hello world!\n'
sub1 = re.sub(r'alert\(\"(.*)\"\)','Hello World!',content)
#print sub1
import re
url = 'http://192.168.1.170:8000'
content = urllib2.urlopen(url).read()
file = open('results.txt','w')
file.write(str(content))
file.close
pattern1 = re.findall(r'alert\(\"(.*)\"\)',content)
for i in pattern1:
print i
print 'hello world!\n'
sub1 = re.sub(r'alert\(\"(.*)\"\)','Hello World!',content)
#print sub1
相关文章推荐
- C# WebBrowser 编程 使用mshtml读取网页内容
- Python读取网页内容的方法
- 分享:Python3伪装浏览器爬虫读取网页内容
- Python 读取网页内容 乱码问题
- Python3伪装浏览器爬虫读取网页内容
- Python伪装浏览器爬虫读取网页内容
- Python读取网页内容的方法
- Python3伪装浏览器爬虫读取网页内容
- python打开url并按指定块读取网页内容的方法
- 【python 编程】网页中文过滤分词及词频统计
- Python伪装浏览器爬虫读取网页内容
- iphone存储以及读取指定文件(Documents)中的内容
- U3D通过获取网页代码读取网页内容
- 使用python读取txt文件的内容,并删除重复的行数方法
- shell怎么读取网页内容
- 用python的curl和lxml来抓取和分析网页内容
- Python 网络爬虫 004 (编程) 如何编写一个网络爬虫,来下载(或叫:爬取)一个站点里的所有网页
- python 实现读取excel中的内容
- [python爬虫] Selenium爬取内容并存储至MySQL数据库
- python下载网页内容出现乱码