从网页中提取email地址的小程序
2011-07-15 15:09
246 查看
程序很小,但是功能却很强大,很有意思。当你输入一个网页的url地址之后,就能把网页中的全部电子邮箱地址揪出来。主要运用了URL类和正则表示式。不过程序有一个bug。当电子邮箱的地址跨越两行时不能很好的处理。当然也有一个不太理想的解决方案:就是把网页内全部读入一个字符串变量中再进行处理。下面是程序的代码:
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; import java.util.regex.Matcher; import java.util.regex.Pattern; public class EmailSpider { public static void main(String[] args) { if (args.length > 0) { try { URL url = new URL(args[0]);//创建url对象 InputStream in = url.openStream(); BufferedReader r=new BufferedReader(new InputStreamReader(in)); String line=""; while((line=r.readLine())!=null){ parse(line); } } catch (MalformedURLException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } } private static void parse(String line) { Pattern p = Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+"); Matcher m = p.matcher(line); while(m.find()) { System.out.println(m.group()); } } }
相关文章推荐
- 如何在网页中提取Email地址
- 抓取网页文件中的email地址的简易java程序
- Java写的抓取任意网页中email地址的小程序
- 简单小程序-抓取网页中的email地址。
- 抓取网页文件中的email地址的简易java程序
- java程序--从网页中提取电子邮箱地址
- 基于python的邮件地址提取小程序
- 通过网页地址提取视频的类库
- 在繁杂的网页中揪出email地址
- python 获取网页中所有email地址
- 使用mailto在网页中链接Email地址
- 获取网页中所有的email地址
- ACE学习笔记 ----- 一个简单的网页链接提取程序
- 网页上隐藏Email地址的方法
- 写一个Email地址校验程序
- 用正则表达式提取网页中的邮箱地址
- Java程序打开指定地址网页
- 使用mailto在网页中链接Email地址
- 使用Apache PDFBox从一堆pdf论文中提取出作者Email地址
- 作业五:开源项目“网页正文提取”的理解——Winform程序