base64编码简介及具体实现
2013-03-29 17:52
337 查看
base64编码想必很多人都有接触过,之前我在写程序的时候多多少少接触过base64的相关知识,但那个时候知识最基础的使用而已,并没有去真正了解这个编码的相关知识,现在来做一次系统的整理。
首先,需要了解一下base64的基础知识。什么事base64编码。wiki百科是这样介绍base64(中文)的,这里只是初略的介绍了一下,base64即是一种用6bit来表示一个字符的编码,常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据,包括MIME的email,email
via MIME, 在XML中存储复杂数据,还有就是对URL及文件名进行编码。当然,想深入了解的话也可以看看the RFC that currently defines Base64这个标准。
然后,为什么需要用到base64编码呢,首先我们看看Why do we use Base64?。按照这些问答中的说法,这可以说是一个历史遗留原因,就是说之前搞了很多套编码方式,造成后面非常紊乱,系统之间因为编码方式的不同而没法正确解码文本,最后base64这一通用的编码方式出来了,这样大家都能正确的对数据进行编解码,不过base64编码会增加原有数据长度,基本上就是原长度的4/3。
另外,base64也能对数据进行加密,数据经base64编码后,一眼是看不出是什么内容的,当然,如果你一定要去解码的话,这也是很容易做到的事。
看个wiki上的例子吧,一段引用自托马斯·霍布斯的利维坦的文句:
Man is distinguished, not only by his reason, but by this singular passion from other animals, which is a lust of the mind, that by a perseverance of delight in the continued and indefatigable generation of knowledge, exceeds the short vehemence of any
carnal pleasure.
经过base64编码之后变成:
TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlz
IHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2Yg
dGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGlu
dWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRo
ZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=
接下来在讨论下base64是怎样编码的,Base64要求把每 3个8Bit字节转换为 4个6Bit字节(3*8 = 4*6 = 24)然后把6Bit再添两位高位0组成 4个8Bit字节也就是说转换后串理论上将要比原来长1/3
转换前 aaaaaabb ccccdddd eeffffff
转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff
最后上源码:
这里为了不占太多篇幅,我就不直接贴代码了,这部分的代码在chromium工程中有modp_b64_data.h,modp_b64.h,modp_b64.cc,写的很完善,算法描述的也挺仔细,想深入了解的可以看看。重点看看编码:modp_b64_encode和解码modp_b64_decode这两个方法。
首先,需要了解一下base64的基础知识。什么事base64编码。wiki百科是这样介绍base64(中文)的,这里只是初略的介绍了一下,base64即是一种用6bit来表示一个字符的编码,常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据,包括MIME的email,email
via MIME, 在XML中存储复杂数据,还有就是对URL及文件名进行编码。当然,想深入了解的话也可以看看the RFC that currently defines Base64这个标准。
然后,为什么需要用到base64编码呢,首先我们看看Why do we use Base64?。按照这些问答中的说法,这可以说是一个历史遗留原因,就是说之前搞了很多套编码方式,造成后面非常紊乱,系统之间因为编码方式的不同而没法正确解码文本,最后base64这一通用的编码方式出来了,这样大家都能正确的对数据进行编解码,不过base64编码会增加原有数据长度,基本上就是原长度的4/3。
另外,base64也能对数据进行加密,数据经base64编码后,一眼是看不出是什么内容的,当然,如果你一定要去解码的话,这也是很容易做到的事。
看个wiki上的例子吧,一段引用自托马斯·霍布斯的利维坦的文句:
Man is distinguished, not only by his reason, but by this singular passion from other animals, which is a lust of the mind, that by a perseverance of delight in the continued and indefatigable generation of knowledge, exceeds the short vehemence of any
carnal pleasure.
经过base64编码之后变成:
TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlz
IHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2Yg
dGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGlu
dWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRo
ZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=
接下来在讨论下base64是怎样编码的,Base64要求把每 3个8Bit字节转换为 4个6Bit字节(3*8 = 4*6 = 24)然后把6Bit再添两位高位0组成 4个8Bit字节也就是说转换后串理论上将要比原来长1/3
转换前 aaaaaabb ccccdddd eeffffff
转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff
最后上源码:
这里为了不占太多篇幅,我就不直接贴代码了,这部分的代码在chromium工程中有modp_b64_data.h,modp_b64.h,modp_b64.cc,写的很完善,算法描述的也挺仔细,想深入了解的可以看看。重点看看编码:modp_b64_encode和解码modp_b64_decode这两个方法。
相关文章推荐
- base64编码简介及具体实现
- Base64编码介绍及基于Java语言实现
- Base64编码的实现(三种方式)
- 利用ADO STREAM实现BASE64编码和解码
- 关于base64编码的原理及实现
- 利用 XML 实现 BASE64 编码和解码
- 借助FileReader实现将文件编码为Base64后通过AJAX上传
- BASE64编码在C#、Delphi和JavaScript中的实现
- Base64编码解码c语言实现
- BASE64编码在C#、Delphi和JavaScript中的实现
- 教你用Perl 实现Base64编码
- C语言实现Base64编码
- S实现base64编码与解码
- 关于base64编码的原理及实现
- 关于base64编码的原理及实现
- gbk编码的简介以及针对gbk文本飘红截断原理以及实现
- C语言实现base64编码,base64解码
- Base64编码原理及编码、解码实现
- Base64编码、解码的实现(一)