python 抽取信息
2013-08-22 19:55
169 查看
获取网页中的信息,用到了BeautifulSoup和tornado
#!/usr/bin/env python3
from bs4 import BeautifulSoup
#import tornado.httpclient
import tornado
from tornado import httpclient
cli=tornado.httpclient.HTTPClient()
link='http://www.iciba.com/'
search=raw_input('search: ')
link+=search
data=cli.fetch(link)
body=data.body.decode('utf8')
soup=BeautifulSoup(body)
group=soup.find_all(class_='group_pos')
group2=group[0].find_all('p')
for ele in group2:
print(ele.find(class_='fl').get_text())
result=ele.find_all('label')
for r in result:
print(r.get_text())
#!/usr/bin/env python3
from bs4 import BeautifulSoup
#import tornado.httpclient
import tornado
from tornado import httpclient
cli=tornado.httpclient.HTTPClient()
link='http://www.iciba.com/'
search=raw_input('search: ')
link+=search
data=cli.fetch(link)
body=data.body.decode('utf8')
soup=BeautifulSoup(body)
group=soup.find_all(class_='group_pos')
group2=group[0].find_all('p')
for ele in group2:
print(ele.find(class_='fl').get_text())
result=ele.find_all('label')
for r in result:
print(r.get_text())
相关文章推荐
- Python中文文本信息抽取中常见的正则表达式
- Python信息抽取之乱码解决
- 用timex抽取文本中的时间信息(python)
- Python信息抽取之乱码解决办法
- 用Python程序抓取网页的HTML信息的一个小实例
- python获取url的返回信息
- MOOC-Python网络爬虫与信息提取-第二周 BeautifulSoup库入门与信息提取方法
- [Python]网页信息抓取
- PyCharm创建新的Python文件时设置默认信息
- Python抓取淘女郎网页信息以及代码下载
- Python爬取V聊视频从信息入库到下载
- Python 基础 员工信息列表
- python使用在线API查询IP对应的地理位置信息实例
- python 读取apk信息
- 使用python抓取有道词典的网页并返回结果信息
- 一个简单的python爬虫程序 爬取豆瓣热度Top100以内的电影信息
- 用Python开始机器学习(5:文本特征抽取与向量化)
- Python3 pyspider(二)大众点评商家信息爬取
- python安装完高版本后还显示低版本信息的解决方法
- 使用 Python 获取 Linux 系统信息