【爬虫工具】下载博客转成Markdown的形式
2018-01-28 15:04
169 查看
简单的爬虫工具
下载博客,并转成Markdown的形式为什么要写这个工具
主要是为了收集好的网上资源,每次看到一篇好的文章就像保存下来,但是保存网页的可读性太差了,如果转换成Markdown的形式就很舒服。但是网页中会有许多无聊的标签干扰,于是写个简单的工具使用的python库
beautifulsoup4requests
html2text
目录
csdn.py csdn博客爬虫jianshu.py 简书博客爬虫
juejin.py 掘金文章爬虫
segmentfault.py segmentfault文章爬虫
使用方法举例
import html2md url_list = [ 'http://blog.csdn.net/qq_37482544/article/details/63720726', # csdn 'https://www.jianshu.com/p/b6220e99df2d', # jianshu 'https://juejin.im/post/5a68437b6fb9a01ca47aabc6', # juejin 'https://segmentfault.com/a/1190000011929414', # segmentfault 'http://www.voidcn.com/article/p-giqfrkhb-bbr.html', # 其他 'https://www.cnblogs.com/zxqstrong/p/4789105.html' ] for url in url_list: checkSite(url)
项目地址
https://github.com/No-96/FengTools/tree/master/downloBolg相关文章推荐
- 推荐一个好的博客下载工具
- 秋色园QBlog技术原理解析:博客一键安装工具技术实现[附源码下载]
- markdown编辑工具-Haroopad下载安装
- 建立程序设计知识库 博客下载工具
- python脚本工具-1 制作爬虫下载网页图片
- 【XPath Helper:chrome爬虫网页解析工具 Chrome插件】XPath Helper:chrome爬虫网页解析工具 Chrome插件下载_教程_安装 - 开发者插件 - Chrome插件网
- 【python】爬虫1——下载博客文章
- markdown写博客工具
- 秋色园QBlog技术原理解析:博客一键安装工具技术实现[附源码下载]
- python爬虫代码-CSDN博客下载
- 美女图片爬虫下载工具(pc 桌面软件)
- python 爬虫 CSDN博客下载-改进版
- 博客(文本)编辑工具Markdown使用初体验
- 博客(文本)编辑工具Markdown使用初体验
- 博客备份工具 Blog Backup v0.6.1 下载