用java从网络上抓取HTML文件内容并写入本地文本中
2009-03-18 15:24
691 查看
package Tech; import java.io.BufferedOutputStream; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.net.URI; import java.net.URISyntaxException; import java.net.URL; public class GetHtmlFile { /** * @param args * @throws IOException * @throws URISyntaxException */ public static void main(String[] args) throws IOException, URISyntaxException { // TODO Auto-generated method stub URL url= new URL("http://www.163.com"); InputStream is = url.openStream(); //OutputStream ois= url.openConnection().getOutputStream(); File file = new File(new URI("file:/c:/g3.txt")); FileOutputStream fos = new FileOutputStream(file); BufferedOutputStream bos = new BufferedOutputStream(fos); int ch; while((ch=is.read())!=-1) { bos.write(ch); bos.flush(); //System.out.print((char)ch); } } }
代码都是些基础代码,不过那个本地File的URI的创建搞了我很长时间,在网上也没搜到啥··
先后试过:
new URI("file://C://g.txt")
Exception:Illegal character in authority
new URI("file://C:/g.txt")
Exception:URI has an authority component
最后试出了结果
new URI("file:/c:/g3.txt")
最后从有关书籍上查得,正解应该是这样的.
URL url = new URL("file://" + realPath); //for Linux
URL url = new URL("file:///" + realPath); //for Windows
相关文章推荐
- 用java从网络上抓取HTML文件内容并写入本地文本中
- Java文件写入文本内容方法
- 通过java的io流将本地文件读取到控制台,并将文件内容再次写入另一个文件中
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例 .
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- Java读取和写入文本文件内容
- Java 通过URL地址下载文本内容到本地文件中
- java 追加内容写入本地文件
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法
- Java操作读取写入文本TXT及XML文件内容
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- JAVA 创建TXT文件,写入文件内容,读取文件内容