您的位置:首页 > 大数据

关于webservice大数据量传输时的压缩和解压缩

2014-07-14 11:08 183 查看
当访问WebSerivice时,如果数据量很大,传输数据时就会很慢。为了提高速度,我们就会想到对数据进行压缩。首先我们来分析一下。

当在webserice中传输数据时,一般都采用Dataset进行数据传输。执行的过程就是先把Dataset转化为xml进行传输,Dataset转化为xml的格式如下:

[html] view plaincopy

<DataSetName>

<DataTableName>

<Column1Name>.......</Column1Name>

<Column2Name>.......</Column2Name>

<Column3Name>.......</Column3Name>

</DataTableName>

...

...

...

<DataSetName>

很明显的可以看到,Datase在t转化为xml的过程中增加了大量的xml格式数据,这样也就加大了传输量。

经过分析,我们就可以找到两个解决数据传输量大的问题的方法:

1.不直接使用Dataset来传输数据,避免转化为xml时增加的额外数据。所以我们可以将Dataset转化为DataSetSurrogate对象用Binary进行序列化,用二进制数据来传输数据。当然你也可以采用其他更好的方式,总之就是减少为了传输而增加的额外数据

2.对数据进行压缩后再传输,至于压缩的方法有很多,可以参考我的文章.net中压缩和解压缩的研究

参考代码如下(这里使用的是.net自带的Gzip进行压缩的,压缩效率可能不是太好):

[html] view plaincopy

//=========================================================================

//类名:DataSetZip

/// <summary>

/// 当DataSet中的数据量很大时,进行网络数据传递时,速度会很慢。

/// 本类将Dataset转化为DataSetSurrogate对象用Binary进行序列化,

/// 然后进行压缩之后进行传输,最后进行解压缩

/// </summary>

/// <remarks>

/// 将DataSet中的DataTable中的数据进行转换或复原

/// </remarks>

/*=========================================================================

变更记录

序号 更新日期 开发者 变更内容

001 2008/7/22 张 新建

=========================================================================*/

public class DataSetZip

{

//消息ID

private const string MSG_ERR_INTERNAL = "MFWE00016";

/// <summary>

/// 取得将DataSet转化为DataSetSurrogate对象用Binary进行序列化,并压缩后的二进制数组

/// </summary>

/// <param name="dsData">需压缩的DataSet数据</param>

/// <returns>压缩后二进制数组</returns>

public static byte[] GetDataSetZipBytes(DataSet dsData)

{

try{

DataSetSurrogate dss = new DataSetSurrogate(dsData);

BinaryFormatter ser = new BinaryFormatter();

MemoryStream ms = new MemoryStream();

ser.Serialize(ms, dss);

byte[] buffer = ms.ToArray();

byte[] Zipbuffer = Compress(buffer);

return Zipbuffer;

}

catch (Exception ex)

{

throw new DataSetConverterException(MSG_ERR_INTERNAL, new string[] { "DataSetZip", "GetDataSetZipBytes" }, ex, null);

}

}

/// <summary>

/// 用.net自带的Gzip对二进制数组进行压缩,压缩比率可能不是太好

/// </summary>

/// <param name="data">二进制数组</param>

/// <returns>压缩后二进制数组</returns>

public static byte[] Compress(byte[] data)

{

MemoryStream ms = new MemoryStream();

Stream zipStream = null;

zipStream = new GZipStream(ms, CompressionMode.Compress, true);

zipStream.Write(data, 0, data.Length);

zipStream.Close();

ms.Position = 0;

byte[] compressed_data = new byte[ms.Length];

ms.Read(compressed_data, 0, int.Parse(ms.Length.ToString()));

return compressed_data;

}

/// <summary>

/// 对二进制数组进行解压缩

/// </summary>

/// <param name="data">二进制数组</param>

/// <returns>解压缩后的DataSet</returns>

public static DataSet Decompress(byte[] data)

{

try

{

byte[] buffer = null;

MemoryStream zipMs = new MemoryStream(data);

buffer = EtractBytesFormStream(zipMs, data.Length);

BinaryFormatter ser = new BinaryFormatter();

DataSetSurrogate dss = ser.Deserialize(new MemoryStream(buffer)) as DataSetSurrogate;

DataSet dsData = dss.ConvertToDataSet();

return dsData;

}

catch(Exception ex)

{

throw new DataSetConverterException(MSG_ERR_INTERNAL, new string[] { "DataSetZip", "Decompress" }, ex, null);

}

}

/// <summary>

/// 用.net自带的Gzip对数据流进行解压缩

/// </summary>

/// <param name="zipMs">数据流</param>

/// <param name="dataBlock">数据长度</param>

/// <returns>解压缩后的二进制数组</returns>

public static byte[] EtractBytesFormStream(MemoryStream zipMs, int dataBlock)

{

byte[] data = null;

int totalBytesRead = 0;

Stream zipStream = null;

zipStream = new GZipStream(zipMs, CompressionMode.Decompress);

while (true)

{

Array.Resize(ref data, totalBytesRead + dataBlock + 1);

int bytesRead = zipStream.Read(data, totalBytesRead, dataBlock);

if (bytesRead == 0)

{

break;

}

totalBytesRead += bytesRead;

}

Array.Resize(ref data, totalBytesRead);

return data;

}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: