java爬取百度首页源代码
2017-06-19 22:41
183 查看
爬虫感觉挺有意思的,写一个最简单的抓取百度首页html代码的程序。虽然简单了一点,后期会加深的。
package test; import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.URL; import java.net.URLConnection; public class Main { public static void main(String[] args) { // 定义即将访问的链接 String url = "https://www.baidu.com/"; // 定义一个字符串用来存储网页内容 String result = ""; // 定义一个缓冲字符输入流 BufferedReader in = null; try { // 将string转成url对象 URL realUrl = new URL(url); // 初始化一个链接到那个url的连接 URLConnection connection = realUrl.openConnection(); // 开始实际的连接 connection.connect(); // 初始化 BufferedReader输入流来读取URL的响应 in = new BufferedReader(new InputStreamReader(connection.getInputStream())); // 用来临时存储抓取到的每一行的数据 String line; while ((line = in.readLine()) != null) { // 遍历抓取到的每一行并将其存储到result里面 result += line + "\n"; } } catch (Exception e) { System.out.println("发送GET请求出现异常!" + e); e.printStackTrace(); } // 使用finally来关闭输入流 finally { try { if (in != null) { in.close(); } } catch (Exception e2) { e2.printStackTrace(); } } System.out.println(result); } }
相关文章推荐
- java爬取百度首页logo
- Selenium2学习-009-WebUI自动化实战实例-007-Selenium 8种元素定位实战实例源代码(百度首页搜索录入框及登录链接)
- 我写的一个从百度服务器获取应答的程序_本来想获取百度首页的源代码的
- Java写的爬虫爬百度首页Code《转自零基础写Java知乎爬虫之先拿百度首页练练手》
- 零基础写Java知乎爬虫之先拿百度首页练练手
- 零基础写Java知乎爬虫之先拿百度首页练练手
- 零基础写Java知乎爬虫之先拿百度首页练练手
- java爬虫入门之访微企点首页源代码
- 转载:零基础写Java知乎爬虫之先拿百度首页练练手
- 最近发现 java抓取不到baidu首页源代码
- java网络爬虫入门实例——以爬取百度首页源代码为例
- 为什么百度首页的HTML源代码最后一行要多一行?浪费空间呀!
- Java爬虫历险记 -- (1)爬取百度首页的logo
- Java手机游戏习作“扫雷”,免费下载(含Java源代码)。
- java源代码分析----jvm.dll装载过程
- 一个简单的用JAVA实现的屏幕抓图(源代码)
- 中国被爱可以在线WAP站点首页源代码
- 如何在网页中保持C,Java..等源代码语法着色
- Java虚拟网络机器人源代码
- Java手机游戏习作“扫雷”,免费下载(含Java源代码)。