您的位置:首页 > Web前端 > JavaScript

[Jsoup] Jsoup概述

2017-02-14 18:48 183 查看
Jsoup简介



1. 背景:我第一次接触Jsoup的时候是在11年、相信做过一些数据挖掘的同学都听说过几种爬虫框架、比如当时风靡的htmlParser。Jsoup的创始人Jonathan
Hedley
在2009年正式推出了基于java语言的开源框架Jsoup。Jsoup相对htmlParser入手简单、在操作DOM上尤其是在操作DOM的特定数据上尤为突出。jsoup相对httpclient在模拟模拟浏览器方面较弱。

2. Jsoup来自官方的释义:是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

3. Externallinks

   ① Jsoup官网:http://jsoup.org/
   ② Github地址:https://github.com/jhy/jsoup
   ③ jar包及API下载:https://jsoup.org/download



  4. 作者介绍
  Jonathan HedleyWeb scale工程师、Technology
Leader。

  美国亚马逊公司技术主管、location位于美国华盛顿州,西雅图。

  Jonathan Hedley的个人站主页:https://jhy.io/

5. 许可状态

Jsoup基于MIT许可协议(The MIT License)发布、遵循MIT协议可用于商业使用。

6. 由Jsoup提供技术支持的项目

Hibernate Validator Engine、google的OpenRefine
data-wrangling tool等

7. 最新release版本

jsoup release1.10.2(2017-Jan-02)



注:本文原创由`bluetata`发布于blog.csdn.net、转载请务必注明出处。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: