java 开发小记:WebClient,获取互联网资源(尤其需关注源的编码)
2009-10-19 14:57
555 查看
.csharpcode, .csharpcode pre
{
font-size: 12px;
color: black;
font-family: consolas, "Courier New", courier, monospace;
background-color: #ffffff;
/*white-space: pre;*/
}
.csharpcode pre { margin: 0em; }
.csharpcode .rem { color: #008000; }
.csharpcode .kwrd { color: #0000ff; }
.csharpcode .str { color: #006080; }
.csharpcode .op { color: #0000c0; }
.csharpcode .preproc { color: #cc6633; }
.csharpcode .asp { background-color: #ffff00; }
.csharpcode .html { color: #800000; }
.csharpcode .attr { color: #ff0000; }
.csharpcode .alt
{
background-color: #f4f4f4;
width: 100%;
margin: 0em;
}
.csharpcode .lnum { color: #606060; }
所有小记将本着简化编码细节的原则进行,以使得今后开发回避技术的冗余面,而更多关注业务逻辑!
这段代码将向你介绍几个比较常见但需要注意的问题:
1,尽量使用本地配置资源,比如 System.getProperty("line.separator") 代替手工输入 “\r\n”,以此解决跨平台问题(Windows、Mac等)。
2,如何利用程序读取互联网上的文本资源,以及注意其文本编码(Encoding,这是本文的要点)。
3,使用 StringBuilder 而不是“String 相加”获取一个较大的变长文本,这主要影响程序性能,而不是功能。
功能极其有限,但对于初学者肯定有其碰壁之处,使用该包装好的类,可使用如下方式获取互联网文本资源:
如下是 WebClient 类的源码:
{
font-size: 12px;
color: black;
font-family: consolas, "Courier New", courier, monospace;
background-color: #ffffff;
/*white-space: pre;*/
}
.csharpcode pre { margin: 0em; }
.csharpcode .rem { color: #008000; }
.csharpcode .kwrd { color: #0000ff; }
.csharpcode .str { color: #006080; }
.csharpcode .op { color: #0000c0; }
.csharpcode .preproc { color: #cc6633; }
.csharpcode .asp { background-color: #ffff00; }
.csharpcode .html { color: #800000; }
.csharpcode .attr { color: #ff0000; }
.csharpcode .alt
{
background-color: #f4f4f4;
width: 100%;
margin: 0em;
}
.csharpcode .lnum { color: #606060; }
所有小记将本着简化编码细节的原则进行,以使得今后开发回避技术的冗余面,而更多关注业务逻辑!
这段代码将向你介绍几个比较常见但需要注意的问题:
1,尽量使用本地配置资源,比如 System.getProperty("line.separator") 代替手工输入 “\r\n”,以此解决跨平台问题(Windows、Mac等)。
2,如何利用程序读取互联网上的文本资源,以及注意其文本编码(Encoding,这是本文的要点)。
3,使用 StringBuilder 而不是“String 相加”获取一个较大的变长文本,这主要影响程序性能,而不是功能。
功能极其有限,但对于初学者肯定有其碰壁之处,使用该包装好的类,可使用如下方式获取互联网文本资源:
WebClient wc = new WebClient(); String s = wc.getContent("http://localhost:8088/index.jsp", "utf-8", null); System.out.println(s);
如下是 WebClient 类的源码:
package queen.net; import java.net.URL; import java.net.URLConnection; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; public class WebClient{ private static String _newLine = System.getProperty("line.separator"); public WebClient(){ } public String getContent(String url, String oriEncoding, String targetEncoding) throws IOException{ URL u = new URL(url); URLConnection uc = u.openConnection(); BufferedReader in; if(oriEncoding == null || oriEncoding.length() == 0){ in = new BufferedReader(new InputStreamReader(uc.getInputStream())); } else{ in = new BufferedReader(new InputStreamReader(uc.getInputStream(), oriEncoding)); } String line; StringBuilder sb = new StringBuilder(); while((line = in.readLine()) != null){ sb.append(line); sb.append(_newLine); } if(targetEncoding == null || targetEncoding.length() == 0){ return sb.toString(); } return new String(sb.toString().getBytes(), targetEncoding); } }
相关文章推荐
- javaWeb开发中读取资源文件方法总结
- Java Web整合开发(10) -- 资源国际化
- WEB开发中的JAVA字符编码经验总结
- 【JavaWeb-6】HttpServletResponse的字符字节输出流、编码、文件下载、Captcha图片与HttpServletRequest获取request数据表单非表单数据、重定向与转发
- WEB开发中的JAVA字符编码经验总结
- JavaWeb开发编码系列(三)—— URL规范
- JavaWeb开发编码系列(五)—— Java的URL编码
- JavaWeb开发一次获取表单form 的全部参数
- 关注C++/Java/C#技术, 致力于安防监控/移动应用/WEB方面开发 的地址
- JavaWeb中获取资源文件路径
- JavaWeb学习笔记——开发动态WEB资源(一)Java程序向浏览器输出数据
- Javaweb开发的资源文件位置问题
- Java web开发中读取资源文件
- Java Web开发之httpServletRequest获取客户端真实ip
- JavaWeb开发常见乱码处理之设置编码方式
- Java Web开发之Servlet获取ckeditor内容
- WEB开发中的JAVA字符编码经验总结
- Java web 开发构想[三] 页面资源
- Java Web开发之Servlet获取ckeditor内容
- WEB开发中的JAVA字符编码经验总结