[置顶] 【python 爬虫】识别网站所用技术
2017-09-17 10:16
811 查看
有一个十分有用的工具可以检查网站构建的技术类型——builtwith 模块(只支持python2环境,python3环境报错)。
该模块将 URL 作为参数,下载该 URL 并对其进行分析,然后返回该网站使用的技术。
举个例子:
用的python flask框架写的。
再来看下csdn用的什么技术。(lua语言写的)
pip install builtwith
该模块将 URL 作为参数,下载该 URL 并对其进行分析,然后返回该网站使用的技术。
举个例子:
>>> import builtwith >>> builtwith.parse('http://xxxxxxxxxxxxxxxxxx') {u'javascript-frameworks': [u'jQuery', u'Moment.js'], u'web-frameworks': [u'Flask', u'Twitter Bootstrap'], u'programming-languages': [u'Python'], u'web-servers': [u'Python']} >>>
用的python flask框架写的。
再来看下csdn用的什么技术。(lua语言写的)
>>> builtwith.parse('http://blog.csdn.net/') {u'javascript-frameworks': [u'jQuery'], u'font-scripts': [u'Font Awesome'], u'web-frameworks': [u'Twitter Bootstrap'], u'programming-languages': [u'Lua'], u'web-servers': [u'OpenResty', u'Nginx']} >>>
相关文章推荐
- python builtwith识别网站所用技术
- python识别网站所用技术
- 爬虫(识别网站所用技术)
- 《用python写网络爬虫》--识别网站所用技术
- 识别网站所用技术及所有者——builtwith与whois模块学习笔记
- [置顶] [爬虫]用Python抓取非小号网站数字货币(二)
- python3使用builtwith识别网站使用相关技术
- python3使用builtwith识别网站使用相关技术
- [置顶] 【python 域名所有者识别】python 识别网站域名 所有者
- [置顶] 谣言识别系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯)
- [置顶] 【python 爬虫】Python爬虫技术分享
- [置顶] [爬虫]用Python抓取非小号网站数字货币(一)
- 【实战\聚焦Python分布式爬虫必学框架Scrapy 打造搜索引擎项目笔记】第4章 scrapy爬取知名技术文章网站(2)
- 【实战\聚焦Python分布式爬虫必学框架Scrapy 打造搜索引擎项目笔记】第4章 scrapy爬取知名技术文章网站(1)
- java技术简易的网站爬虫
- Python使用OCR技术识别图片中的文字(入门篇)
- python爬虫实例-爬取壁纸网站
- Python爬虫之模拟CSDN网站登录
- [置顶] 大型网站技术架构(二)架构模式
- <四>、python爬虫抓取购物网站商品信息--图片价格名称