淘宝网或阿里巴巴模拟登陆获取数据
2017-08-30 09:09
537 查看
近期,有人将本人博客,复制下来,直接上传到百度文库等平台。
本文为原创博客,仅供技术学习使用。未经允许,禁止将其复制下来上传到百度文库等平台。如有转载请注明本文博客的地址(链接)
源码如有需要请联系:1563178220@qq.com
本文为原创博客,仅供技术学习使用。未经允许,禁止将其复制下来上传到百度文库等平台。如有转载请注明本文博客的地址(链接)
源码如有需要请联系:1563178220@qq.com
所获得的数据
如下图所示,为所要爬取的阿里巴巴供应商数据。在爬取之前必须模拟登陆阿里巴巴网站。工程目录结构
模拟登陆程序
如下程序,主要采用selenium工具进行模拟登陆。/** * @author:合肥工业大学 管理学院 sober_qian * @email:1563178220@qq.com * @ */ public String click(String username, String password) throws InterruptedException { System.setProperty("webdriver.gecko.driver", "chrome\\geckodriver.exe"); WebDriver webDriver = new FirefoxDriver(); // webDriver.manage().timeouts().implicitlyWait(30, TimeUnit.SECONDS); String baseUrl = "https://login.1688.com/"; webDriver.get(baseUrl + "/member/signin.htm?spm=0.0.0.0.ijAHe8&Done=https%3A%2F%2Fs.1688.com%2Fcompany%2Fcompany_search.htm%3Fkeywords%3D%25B7%25FE%25D7%25B0%26button_click%3Dtop%26n%3Dy%26sortType%3Dpop%26pageSize%3D30%26offset%3D3%26beginPage%3D1"); webDriver.switchTo().frame(0); webDriver.findElement(By.id("J_Quick2Static")).click(); //休息5秒 Thread.sleep(5000); webDriver.findElement(By.cssSelector("span.ph-label")).click(); webDriver.findElement(By.id("TPL_username_1")).clear(); webDriver.findElement(By.id("TPL_username_1")).sendKeys(username); webDriver.findElement(By.id("TPL_password_1")).clear(); webDriver.findElement(By.id("TPL_password_1")).sendKeys(password); }
数据展示
相关文章推荐
- 跟着百度学PHP[17]-PHP扩展CURL的模拟登陆并获取数据
- 网络爬虫模拟登陆获取数据并解析实战(二)
- POST获取网易博客数据(网页抓取,模拟登陆资料学习备份)
- 爬虫模拟登陆获取需要的数据
- [Jsoup] 模拟浏览器:post方式模拟登陆获取网页数据(二)
- 网络爬虫中的模拟登陆获取数据(实例教学)
- java无需获取cookie实现模拟登陆正方教务系统获取课表等数据
- php curl如何模拟登录阿里妈妈|登陆阿里妈妈获取淘宝客推广数据
- C# 利用HttpWebRequest模拟登陆获取数据设置Accept-Encoding为gzip,deflate后返回的网页是乱码处理
- 【转】PHP 之 CURL 模拟登陆并获取数据
- PHP 之 CURL 模拟登陆并获取数据
- PHP 之 CURL 模拟登陆并获取数据
- 简单写写华软mysise教务系统模拟登陆+获取课程表数据(打造自己的超级课程表)
- python模拟登陆+获取数据
- js 模拟get获取数据
- 模拟提交数据,获取结果
- Android实现模拟登陆教务系统并解析网页数据
- PHP中使用CURL模拟登录并获取数据实例
- PHP模拟登陆获取163邮箱联系人(经测试)
- [Jsoup] 模拟浏览器:get方式简单获取网页数据(一)