您的位置:首页 > Web前端 > JavaScript

jsoup相关的工具类

2017-07-13 14:09 141 查看
package com.kinth.datacrawl.admin.web.webmagic;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

/**
* jsoup相关的工具类
* @author mbm
*
*/
public class JsoupUtils {

/**
* 对url进行连接尝试,如果连接成功则返回true,否则返回false
* @param url
* @return
*/
public static boolean attempConnect(String url){
try {
Jsoup.connect(url)
.timeout(3*1000)
.get();
return true;
} catch (Exception e) {
return false;
}
}

/**
* 下载指定url的文档对象
* @param url
* @return
* @throws IOException
*/
public static Document downloadDocument(String url) throws IOException{
Document document = Jsoup.connect(url).timeout(5*1000).get();
return document;
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  jsoup网络爬虫