Java HTML页面抓取实例
2014-07-18 08:25
429 查看
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.UnsupportedEncodingException; import java.net.HttpURLConnection; import java.net.MalformedURLException; import java.net.URL; public class Url { public static void main(String[] args) throws Exception{ String html = getURLContent(); System.out.println(html); } /** * 获取网页内容 */ private static String getURLContent() throws MalformedURLException, IOException, UnsupportedEncodingException { URL urlmy = new URL("http://www.baidu.com"); HttpURLConnection con = (HttpURLConnection) urlmy.openConnection(); HttpURLConnection.setFollowRedirects(true); con.setInstanceFollowRedirects(false); con.connect(); BufferedReader br = new BufferedReader(new InputStreamReader(con.getInputStream(),"UTF-8")); String s = ""; StringBuffer sb = new StringBuffer(); while ((s = br.readLine()) != null) { sb.append(s+"\r\n"); } return sb.toString(); } }
相关文章推荐
- Java HTML页面抓取实例
- 使用java的html解析器jsoup和jQuery实现一个自动重复抓取任意网站页面指定元素的web应用
- Python使用urllib2模块抓取HTML页面资源的实例分享
- JAVA综合面试题:页面的抓取、解析、保存数据库和生成HTML的
- Java - 抓取优酷网视频播放页面(使用jsoup解析html,正则表达式处理字符串)
- java抓取HTML页面的数据(淘宝页面),
- 使用java的html解析器jsoup和jQuery实现一个自动重复抓取任意网站页面指定元素的web应用
- 【网络爬虫】【java】微博爬虫(二):如何抓取HTML页面及HttpClient使用
- JAVA综合面试题:页面的抓取、解析、保存数据库和生成HTML的页面展示
- 使用java的html解析器jsoup和jQuery实现一个自动重复抓取任意网站页面指定元素的web应用
- 使用java的html解析器jsoup和jQuery实现一个自动重复抓取任意网站页面指定元素的web应用
- Python使用urllib2模块抓取HTML页面资源的实例分享
- 使用java的html解析器jsoup和jQuery实现一个自动重复抓取任意网站页面指定元素的...
- java页面抓取代码
- PHP生成HTML静态页面实例代码
- (转)JAVA综合面试题:页面的抓取、解析、保存数据库和生成HT
- PHP生成HTML静态页面实例代码
- 通过url地址抓取网页html代码 - 可视化Java快速开发平台 - CSDNBlog
- 实例详细讲解ASP生成静态HTML页面方法
- 用java从网络上抓取HTML文件内容并写入本地文本中