您的位置:首页 > 其它

base64编码简介及具体实现

2013-03-29 17:52 337 查看
base64编码想必很多人都有接触过,之前我在写程序的时候多多少少接触过base64的相关知识,但那个时候知识最基础的使用而已,并没有去真正了解这个编码的相关知识,现在来做一次系统的整理。
首先,需要了解一下base64的基础知识。什么事base64编码。wiki百科是这样介绍base64中文)的,这里只是初略的介绍了一下,base64即是一种用6bit来表示一个字符的编码,常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据,包括MIME的email,email
via MIME, 在XML中存储复杂数据,还有就是对URL及文件名进行编码。当然,想深入了解的话也可以看看the RFC that currently defines Base64这个标准。
然后,为什么需要用到base64编码呢,首先我们看看Why do we use Base64?。按照这些问答中的说法,这可以说是一个历史遗留原因,就是说之前搞了很多套编码方式,造成后面非常紊乱,系统之间因为编码方式的不同而没法正确解码文本,最后base64这一通用的编码方式出来了,这样大家都能正确的对数据进行编解码,不过base64编码会增加原有数据长度,基本上就是原长度的4/3。
另外,base64也能对数据进行加密,数据经base64编码后,一眼是看不出是什么内容的,当然,如果你一定要去解码的话,这也是很容易做到的事。

看个wiki上的例子吧,一段引用自托马斯·霍布斯的利维坦的文句:

Man is distinguished, not only by his reason, but by this singular passion from other animals, which is a lust of the mind, that by a perseverance of delight in the continued and indefatigable generation of knowledge, exceeds the short vehemence of any
carnal pleasure.

经过base64编码之后变成:

TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlz

IHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2Yg

dGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGlu

dWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRo

ZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=

接下来在讨论下base64是怎样编码的,Base64要求把每 3个8Bit字节转换为 4个6Bit字节(3*8 = 4*6 = 24)然后把6Bit再添两位高位0组成 4个8Bit字节也就是说转换后串理论上将要比原来长1/3

转换前 aaaaaabb ccccdddd eeffffff

转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff

最后上源码:
这里为了不占太多篇幅,我就不直接贴代码了,这部分的代码在chromium工程中有modp_b64_data.hmodp_b64.hmodp_b64.cc,写的很完善,算法描述的也挺仔细,想深入了解的可以看看。重点看看编码:modp_b64_encode和解码modp_b64_decode这两个方法。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: