java爬虫简单实例
2017-06-02 18:31
288 查看
爬虫的实质就是打开网页源代码进行匹配查找,然后获取查找到的结果。 /* * 获取 * 将正则规则进行对象的封装。 * Pattern p = Pattern.compile("a*b"); * //通过正则对象的matcher方法字符串相关联。获取要对字符串操作的匹配器对象Matcher . * Matcher m = p.matcher("aaaaab"); * //通过Matcher匹配器对象的方法对字符串进行操作。 * boolean b = m.matches(); */ package com.js.ai.modules.pointwall.testxfz; import java.io.BufferedReader; import java.io.FileReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Spider { public static List<String> getMailsByWeb() throws IOException{ //1,读取源文件。 URL url=new URL("http://www.cnblogs.com/Renyi-Fan/p/6896901.html"); BufferedReader bufr=new BufferedReader(new InputStreamReader(url.openStream())); //2,对读取的数据进行规则的匹配。从中获取符合规则的数据. String mail_regex = "\\w+@\\w+(\\.\\w+)+"; List<String> list=new ArrayList<String>(); Pattern p = Pattern.compile(mail_regex); String line = null; while((line=bufr.readLine())!=null){ Matcher m = p.matcher(line); while(m.find()){ //3,将符合规则的数据存储到集合中。 list.add(m.group()); } } return list; } public static List<String> getMails() throws IOException{ //1,读取源文件。 BufferedReader bufr=new BufferedReader(new FileReader("c:\\mail.html")); //2,对读取的数据进行规则的匹配。从中获取符合规则的数据. String mail_regex = "\\w+@\\w+(\\.\\w+)+"; List<String> list = new ArrayList<String>(); Pattern p = Pattern.compile(mail_regex); String line = null; while((line=bufr.readLine())!=null){ Matcher m = p.matcher(line); while(m.find()){ //3,将符合规则的数据存储到集合中。 list.add(m.group()); } } return list; } public static void main(String[] args) throws IOException { // List<String> list = getMails(); // for(String mail : list){ // System.out.println(mail); // } List<String> list=getMailsByWeb(); for(String mail:list){ System.out.println(mail); } } }
相关文章推荐
- java 爬虫详解及简单实例
- JAVA超级简单的爬虫实例讲解
- 连接mysql的javabean实例+简单分页
- AJAX for Java简单表数据查询实例
- java图像界面开发简单实例-JRadioButton、JCheckBox、JLabel的应用
- java Spring的简单应用实例
- 利用Java编写简单的WebService实例
- Java基础的一些简单实例
- [零基础学JAVA]Java SE应用部分-31.Java IO操作(05)IO操作实例讲解之实现简单MIS 推荐
- java图像界面开发简单实例-JTextArea、JScrollPane、JPanel、JButton应用实例
- java图像界面开发简单实例-JButton及事件的简单应用
- Ajax 简单实例Java/.net
- AJAX for Java简单表数据查询实例
- java 一个简单的servlet实例
- java.util.Timer类简单实例
- java图像界面开发简单实例-JCheckBox、JLabel的应用
- 连接mysql的javabean实例+简单分页
- 用JAVA实现屏幕抓图的简单实例
- java图像界面开发简单实例-JOptionPane应用
- 用Java 开发 WebService Axis简单实例