JSP抓取网页代码的程序【转】
2009-12-08 20:35
337 查看
<%@ page contentType="text/html;charset=gb2312"%>
<%
String sCurrentLine;
String sTotalString;
sCurrentLine="";
sTotalString="";
java.io.InputStream l_urlStream;
java.net.URL l_url = new java.net.URL("http://www.163.net/");
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();
l_connection.connect();
l_urlStream = l_connection.getInputStream();
java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));
while ((sCurrentLine = l_reader.readLine()) != null)
{
sTotalString+=sCurrentLine;
}
out.println(sTotalString);
%>
后记
虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。
本文来源于 WEB开发网 原文链接:http://www.cncms.com.cn/jsp/8887.htm
<%
String sCurrentLine;
String sTotalString;
sCurrentLine="";
sTotalString="";
java.io.InputStream l_urlStream;
java.net.URL l_url = new java.net.URL("http://www.163.net/");
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();
l_connection.connect();
l_urlStream = l_connection.getInputStream();
java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));
while ((sCurrentLine = l_reader.readLine()) != null)
{
sTotalString+=sCurrentLine;
}
out.println(sTotalString);
%>
后记
虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。
本文来源于 WEB开发网 原文链接:http://www.cncms.com.cn/jsp/8887.htm
相关文章推荐
- JSP抓取网页代码的程序
- JSP抓取网页代码的程序
- JSP抓取网页代码的程序
- JSP抓取网页代码的程序
- 几种PHP实现网页抓取的程序代码
- C#实现通过程序自动抓取远程Web网页信息的代码
- php 实现信息采集(网页内容抓取)程序代码
- C#实现通过程序自动抓取远程Web网页信息的代码
- jsp“抓”网页代码的程序
- JSP“抓”网页代码的程序
- 本文利用C#和.NET提供的类来轻松创建一个抓取网页内容源代码的程序
- JSP 抓取网页代码
- 抓取网页内容的程序或代码(两层或更多,delphi)
- 几种PHP实现网页抓取的程序代码
- jsp中上传大文件(200M已测试),存到数据库,易发生连接超时的ie找不到网页的错误,其解决方法。略写代码,参考(.net修改代码应该可以,改天修改)
- JSP实现的简单Web投票程序代码
- 网页抓取程序常用的工作流处理器
- C#实现通过程序自动抓取远程Web网页信息
- Python网页抓取程序(续)
- 301重定向设置及程序代码实现全集(ASP|.NET|PHP|JSP)