您的位置:首页 > Web前端 > JavaScript

JSP“抓”网页代码的程序

2017-04-06 15:56 253 查看
JSP“抓”网页代码的程序如下:
java 代码

<%@ page contentType="text/html;charset=gb2312"%>    

<%    

String sCurrentLine;    

String sTotalString;    

sCurrentLine="";    

sTotalString="";    

java.io.InputStream l_urlStream;    

java.net.URL l_url = new java.net.URL("http://www.163.net/");    

java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();   

l_connection.connect();    

l_urlStream = l_connection.getInputStream();    

java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));    

while ((sCurrentLine = l_reader.readLine()) != null)    

{    

sTotalString+=sCurrentLine;    

}    

out.println(sTotalString);    

%>    

后记
  虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: