python爬取百度搜索答案题目和摘要
2017-04-11 16:28
274 查看
url就自行构造吧
# coding:utf-8
import urllib2
import re
from bs4 import BeautifulSoup
url = 'http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=johnkey&oq=john&rsv_pq=88bbfd770000beed&rsv_t=be24xj7KYq9tbjeRa7Fu10sW1dFF0GNZI1%2FW31Bq8OsZWZIwSpuRZxdcfQo&rqlang=cn&rsv_enter=1&inputT=787&rsv_sug3=12&rsv_sug1=7&rsv_sug7=100&rsv_sug2=0&rsv_sug4=787'
request = urllib2.Request(url)
request.add_header('User-Agent','Mozilla/5.0')
response = urllib2.urlopen(request)
html = response.read()
soup = BeautifulSoup(html,'html.parser',from_encoding='utf-8')
links = soup.find_all('div',id=re.compile(r'\d+'))
for link in links:
print link.name,link['id'],link.get_text()
# coding:utf-8
import urllib2
import re
from bs4 import BeautifulSoup
url = 'http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=johnkey&oq=john&rsv_pq=88bbfd770000beed&rsv_t=be24xj7KYq9tbjeRa7Fu10sW1dFF0GNZI1%2FW31Bq8OsZWZIwSpuRZxdcfQo&rqlang=cn&rsv_enter=1&inputT=787&rsv_sug3=12&rsv_sug1=7&rsv_sug7=100&rsv_sug2=0&rsv_sug4=787'
request = urllib2.Request(url)
request.add_header('User-Agent','Mozilla/5.0')
response = urllib2.urlopen(request)
html = response.read()
soup = BeautifulSoup(html,'html.parser',from_encoding='utf-8')
links = soup.find_all('div',id=re.compile(r'\d+'))
for link in links:
print link.name,link['id'],link.get_text()
相关文章推荐
- 用python搭建 百万答题 、自动百度搜索答案
- python实现百万答题自动百度搜索答案
- 百度的在线笔试题目[添加了答案]
- 百度一道笔试题目的答案
- python,抓取百度搜索结果
- python实现的一只从百度开始不断搜索的小爬虫
- 用python和BeautifulSoup抓取百度搜索结果10-20页面中的网站链接
- 百度面试题目的答案
- Python实现抓取百度搜索结果页的网站标题信息
- 2007年百度之星程序设计大赛试题初赛题目-题1-百度的高级搜索方法
- 2007年百度之星程序设计大赛试题初赛题目-题1-百度的高级搜索方法
- python 模拟百度搜索关键词
- 百度加强搜索结果摘要:增加页内命名锚链接直接指向网页段落
- 2011年10月10日16:22:36百度面试题目汇总☆参考答案随后补充☆
- 根据查询的关键字,实现获取百度指定页数的搜索结果的信息(网页地址,标题,摘要,并有排序的说明)
- 解析百度搜索结果页面的python脚本(Linux/Win都可以运行)
- 2007年百度之星程序设计大赛初赛题目——百度的高级搜索方法
- 用python通过apache log 获取百度搜索来源关键词
- 【转】 python socket向百度发送http长连接请求 并做搜索
- Python抓取百度搜索结果