您的位置：首页 > 编程语言 > Python开发

python3 怎么爬取新闻网站？

2017-04-08 02:02 267 查看

先开个坑，以后再填吧.......

import requests
from bs4 import BeautifulSoup
def content(url):
text = requests.get(url)
text.encoding = 'utf-8'
soup2 = BeautifulSoup(text.text,'html5lib')
header2 = soup2.select('h1')[0].text
text2 = soup2.select('#artibody')[0].text
time2 = soup2.select('.time-source')[0].text
print(header2,text2,time2,'\n\n\n')
res = requests.get('http://news.sina.com.cn/china/')
res.encoding = 'utf-8'
soup = BeautifulSoup(res.text,"html5lib")
for news in soup.select('.news-item'):
if len(news.select('h2')) > 0:
header = news.select('h2')[0].text
link = news.select('a')[0]['href']
time = news.select('.time')[0].text
print(link,time)
content(link)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python爬虫根据关键字在新浪网站查询跟关键字有关的新闻条数(按照时间查询)
【Python】爬虫爬取各大网站新闻（一）
django+python开发的网站怎么静态引用img图片
Python爬虫爬取网站新闻
python3爬虫爬取图片，爬取新闻网站文章并保存到数据库
Python 抓取【参考消息网站】的新闻
python3爬取新闻网站的所有新闻-新手起步
Python 利用 BeautifulSoup 爬取网站获取新闻流
基于python Scrapy的爬虫——爬取某网站新闻内容
看Techmeme怎么造就科技界必读新闻网站
Python爬虫项目，获取所有网站上的新闻，并保存到数据库中，解析html网页等(未完待续)
真正开始学习，asp.net了，可是不知道怎么在新闻首页添加可以滚动的新闻条。
网摘精灵教程：网站被搜索引擎屏蔽了，怎么办
C#版的网站新闻发布系统
怎么改善现有网站
行业网站，怎么做？
一些与python有关的网站
怎么改善现有网站
日语新闻听力网站
怎么在网站中绝对定位?

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航