java爬虫一(分析要爬取数据的网站)
2017-09-07 10:33
399 查看
一、获取你想要抓取的网站地址:
http://www.zhaopin.com/
然后打开控制台,F12,打开。我用的是Chrome浏览器,跟个人更喜欢Chrome的控制台字体。
找到搜索栏对应的html标签:
http://sou.zhaopin.com/jobs/searchresult.ashx?jl=%E6%B7%B1%E5%9C%B3&kw=Java&sm=0&p=1
也可以直接在地址栏输入这个网址。和之前在输入职位框输入java,地区为深圳是一致的,在之前点击“搜工作”按钮也是这样跳转到这个页面的。
下面这一栏是搜索的结果条数,可能对于我们执行循环有帮助。
这是定位到某个页面的所有招聘信息的html的div块:
那么具体到某一家公司的招聘信息:
这就对应到这一家公司了:
但是我们需要的是具体的信息,于是我们展开刚才上面那个<table></table>的<tr></tr>:
所有的标签展开内容过长,我们分开来看:
那么还有一个我们在网页上看见的:下拉箭头。打开下拉箭头就会看到详细信息,这里其实该页面的html已经包含了,只是默认隐藏而已。
对应的显示结果:
那么我想获取的是什么信息呢,我不会获取太多信息。这里我只想获取的是“岗位名称”、“经验”、“学历”、“薪水”等。如果需要获取岗位要求和公司地址的话,则必须点击进入该岗位下进行查看。
http://www.zhaopin.com/
然后打开控制台,F12,打开。我用的是Chrome浏览器,跟个人更喜欢Chrome的控制台字体。
找到搜索栏对应的html标签:
http://sou.zhaopin.com/jobs/searchresult.ashx?jl=%E6%B7%B1%E5%9C%B3&kw=Java&sm=0&p=1
也可以直接在地址栏输入这个网址。和之前在输入职位框输入java,地区为深圳是一致的,在之前点击“搜工作”按钮也是这样跳转到这个页面的。
下面这一栏是搜索的结果条数,可能对于我们执行循环有帮助。
这是定位到某个页面的所有招聘信息的html的div块:
那么具体到某一家公司的招聘信息:
这就对应到这一家公司了:
但是我们需要的是具体的信息,于是我们展开刚才上面那个<table></table>的<tr></tr>:
所有的标签展开内容过长,我们分开来看:
那么还有一个我们在网页上看见的:下拉箭头。打开下拉箭头就会看到详细信息,这里其实该页面的html已经包含了,只是默认隐藏而已。
对应的显示结果:
那么我想获取的是什么信息呢,我不会获取太多信息。这里我只想获取的是“岗位名称”、“经验”、“学历”、“薪水”等。如果需要获取岗位要求和公司地址的话,则必须点击进入该岗位下进行查看。
相关文章推荐
- 使用java 爬虫 抓取youtube,youku,facebook 等视频网站的视频数据(请求规则的分析)
- java爬虫爬取网站数据实例
- 基于webmagic的java网页爬虫,抓取网页指定节点,然后使用dom4j分析xml数据
- 使用Java爬虫当数据后台的资源网站搭建(已建成www.ciliyunsou.com)
- Java 关于爬取网站数据遇到csrf-token的分析与解决
- 爬虫数据分析-美食网站最爱甜点top10
- java实现网络爬虫--抓取网站数据
- Java豆瓣电影爬虫——使用Word2Vec分析电影短评数据
- java jsoup 爬虫爬asp.net网站遇到_doPostBack不能获取翻页数据解决办法
- HtmlUnit java爬虫入门 真实案例讲解 爬取电商网站数据
- Java中的类型转换对数据的影响分析
- ranknow.cn网站数据评估 分析 SEO报告
- 电子商务网站基础数据分析
- mysql中kill掉所有锁表的进程爬虫抓取数据分析
- B2C 网站的行为分析与数据挖掘
- 某中小企业网站运营数据分析实例(百度商桥统计)
- 网站数据分析的维度和指标
- 电子商务网站数据分析指标
- java抓取网站数据
- B2C 网站的行为分析与数据挖掘