您的位置:首页 > 移动开发 > Android开发

android解压缩GZIP格式的网页数据

2013-11-26 15:12 155 查看
转载请注明来自:http://blog.csdn.net/icyfox_bupt/article/details/9572813

进行安卓的软件开发就少不了和网络上的数据打交道,为了做出让用户喜爱的软件,我们需要想一切办法减少下载流量,加快下载速度。

GZIP就是现有的一种网站压缩格式,只要网站支持,我们就可以从网站上下载压缩过的数据包。

GZIP的介绍请看百度百科:http://baike.baidu.com/view/966625.htm

启用GZIP:

启用GZIP通信需要服务器和客户端双方的支持,在服务器方面需要打开GZIP选项,(详见WIN2003中IIS开启GZIP的方法),这会增加一些服务器的负担。

如果服务器不是你架设的,那就不用管。

在客户端方面,进行HTTP请求时,要在HTTP的header处添加:

[plain]
view plaincopyprint?

Accept-Encoding: gzip,deflate  

Accept-Encoding: gzip,deflate

如果服务器支持,则在返回数据包的header中会包含:

[plain]
view plaincopyprint?

Accept-Encoding: gzip,deflate  

Accept-Encoding: gzip,deflate


解压GZIP:

下面将使用代码的方式表示解压GZIP的方法,下面这个函数使用了get方法获取网络上的数据,获取后使用GZIPinputStream类对GZIP数据进行了解压。并返回了得到的字符串:

[java]
view plaincopyprint?

public String get(String url){  
      
    HttpGet get=new HttpGet(url);  
    HttpClient client=new DefaultHttpClient();  
                  
    get.addHeader("accept-encoding","gzip, deflate");  
    //在包头中添加gzip格式   
    HttpResponse response=null;  
    ByteArrayBuffer bt= new ByteArrayBuffer(4096);  
    String resultString="";  
      
    try{  
        response=client.execute(get);  
        //执行Get方法      
        HttpEntity he = response.getEntity();  
        //以下是解压缩的过程   
        GZIPInputStream gis = new GZIPInputStream(he.getContent());  
        int l;  
        byte[] tmp = new byte[4096];  
        while ((l=gis.read(tmp))!=-1){  
            bt.append(tmp, 0, l);  
        }  
          
        resultString = new String(bt.toByteArray(),"utf-8");   
        //后面的参数换成网站的编码一般来说都是UTF-8   
          
    }  
    catch(Exception e)  
    {  
        Log.i("ERR",e.toString()); //抛出处理中的异常
  
    }  
              
    return resultString;  
}  

public String get(String url){

HttpGet get=new HttpGet(url);
HttpClient client=new DefaultHttpClient();

get.addHeader("accept-encoding","gzip, deflate");
//在包头中添加gzip格式
HttpResponse response=null;
ByteArrayBuffer bt= new ByteArrayBuffer(4096);
String resultString="";

try{
response=client.execute(get);
//执行Get方法
HttpEntity he = response.getEntity();
//以下是解压缩的过程
GZIPInputStream gis = new GZIPInputStream(he.getContent());
int l;
byte[] tmp = new byte[4096];
while ((l=gis.read(tmp))!=-1){
bt.append(tmp, 0, l);
}

resultString = new String(bt.toByteArray(),"utf-8");
//后面的参数换成网站的编码一般来说都是UTF-8

}
catch(Exception e)
{
Log.i("ERR",e.toString()); //抛出处理中的异常
}

return resultString;
}
上面的代码比较简单,就不多解释了。(其实是我自己也迷迷糊糊啦)思路来自http://bbs.csdn.net/topics/340021298这个文章,大家可以去看。

如果不太理解把上面这段代码直接复制也可以当做get函数来用了。

虽然代码简单,但是GZIP的效果是不容小觑的。对于普通的网页来说,压缩后的数据一般是原来是1/2~2/3,对于一些冗余较大的数据,比如微博、论坛这些冗余较大的API数据,甚至可以达到1/4的效果。这对于省流量来说是非常可观的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: