抓取网页文件中的email地址的简易java程序
2011-08-11 11:03
471 查看
我们可以先下载一个网页文件在自己的硬盘上,然后通过URL地址读取文件,利用这则表达式一一对比所读出的字符串是否是email地址,实现抓取!传说的垃圾邮件首先就是要先再网页中抓取别人的email地址,具体的小程序如下:
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Pattern;
import java.util.regex.*;
public class Spider {
public static void main(String[] args) {
try {
BufferedReader buf = new BufferedReader(new FileReader("F:\\a.mht"));
String line = "";
while ((line = buf.readLine()) != null)
pattern(line);
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
private static void pattern(String line) {
Pattern p = Pattern.compile("[\\w[._]]+@[\\w[._]]+\\.[\\w]+");//email地址的正则表达式;
Matcher m = p.matcher(line);
while(m.find()){
System.out.println(m.group());
}
/*while(p.matcher(line)!=null){
}*/
}
}
相关文章推荐
- 抓取网页文件中的email地址的简易java程序
- Java写的抓取任意网页中email地址的小程序
- java 正则 抓取文件中的email地址
- Java正则表达式(一)、抓取网页email地址实例
- Java正则表达式(一)、抓取网页email地址实例
- Java正则表达式,抓取网页email地址实例
- Java正则表达式,抓取网页email地址实例
- 简单小程序-抓取网页中的email地址。
- Java正则表达式(一)、抓取网页email地址实例
- 关于PHP程序使用file_get_content()函数进行抓取PHP程序与smarty结合编译过程中产生的静态文件,抓取不了?连接超时?(地址映射)
- java程序打包成jar文件(自己实践和查网页解决,以中科院分词工具ICTCLAS5.0 为例)
- JAVA在网页上抓取邮件地址
- 抓取网页Email地址
- java获取网页上邮箱地址存放到.txt文件
- java正则表达式匹配网页email(email抓取)
- 抓取本地网页中的email地址
- java正则表达式的使用1 通过正则表达式抓取网页中的email
- java 读取文件,内容方置Person 序列化到磁盘,在读入程序并写到另外地址
- 从网页中提取email地址的小程序
- 利用JSP获取网页源文件并抓取其中的链接地址