base64编码是怎么工作的?
2015-01-26 14:47
183 查看
1: 为什么需要base64?
ASCII码一共规定了128个字符的编码,这128个符号,范围在[0,127]之间.
其中,[0,31],及127, 33个属于不可打印的控制字符.
在电子邮件传输信息时,有些邮件网关会把[0,31]这些控制字符给悄悄清除.
还有的早期程序,收到[128,255]之间的国际字符时,甚至会发生错误.
如何在不同邮件网关之间安全的传输控制字符,国际字符,甚至二进制文件?
于是作为MIME多媒体电子邮件标准的一部分—base64被开发出来.
2: 一句话说完base64怎么工作的?
把N字节的内容对应的8*N位, 每6位砍成1段,得到 (8*N)/6 个单元,
每个单元的值,都在[0,63]之间,再把其值对应1个ascii字符,拼接起来,OK!
base64_encode(’PHP’) ==> ‘UEhQ’, 编码过程如下:
3: 如果每6位砍成1段,但不能整除,余下2个位或4位怎么办?
用”0″来补至6位, 并再次转化为”base64字符表”中的某个字符.
然后,再用”=”字符当做6个位,继续填充,直至总位数能被8带整除.
4:base64表示图片
通过上面的演示,可以看出,base64也可以编码二进制文件,如邮件中的图片和附件.
编码后,我们可以在网页或邮件的源码里,直接体现此图片,
而不必把图片放在服务器上,引用其链接.
用例:base64(’abc.png’) ==> ‘encoded-result’;
则在网页中, <img src=”data:image/png;base64,encoded-result” />
看到下面这个5角星了吗? 右键看源码,就会发现图片是一串字符串
5: base64编码后字节的变化
很容易推算出, 编码后,每6个位变成8个位.
因此,编码后字节约比编码前多33%.
6: base64串结尾的”=”可以去掉吗?
从上面的编码规则可以反推出, 在base64解码的过程中, 要清除掉结尾处的等号,
然后再反查”base64索引与字母对照表”,转换成原始的字节序列.
那么,去掉尾部的等号,并没有丢失原始信息,但结构变得不规范.
解码前是否判断完整性,这取决于你的应用程序.
实测PHP中的base64_decode函数,并不检测尾部的等号是否完整.
原文:http://www.yanshiba.com/archives/638
ASCII码一共规定了128个字符的编码,这128个符号,范围在[0,127]之间.
其中,[0,31],及127, 33个属于不可打印的控制字符.
在电子邮件传输信息时,有些邮件网关会把[0,31]这些控制字符给悄悄清除.
还有的早期程序,收到[128,255]之间的国际字符时,甚至会发生错误.
如何在不同邮件网关之间安全的传输控制字符,国际字符,甚至二进制文件?
于是作为MIME多媒体电子邮件标准的一部分—base64被开发出来.
2: 一句话说完base64怎么工作的?
把N字节的内容对应的8*N位, 每6位砍成1段,得到 (8*N)/6 个单元,
每个单元的值,都在[0,63]之间,再把其值对应1个ascii字符,拼接起来,OK!
base64_encode(’PHP’) ==> ‘UEhQ’, 编码过程如下:
3: 如果每6位砍成1段,但不能整除,余下2个位或4位怎么办?
用”0″来补至6位, 并再次转化为”base64字符表”中的某个字符.
然后,再用”=”字符当做6个位,继续填充,直至总位数能被8带整除.
字符串 | 二进制序列(红字为填充位) | 编码结果 |
PHP | 010100 000100 100001 010000 | UEhQ |
it | 011010 010111 0100 00 xxxxxx | aXQ= |
bool | 011000 100110 111101 101111 011011 00 0000 xxxxxx xxxxxx | Ym9vbA== |
通过上面的演示,可以看出,base64也可以编码二进制文件,如邮件中的图片和附件.
编码后,我们可以在网页或邮件的源码里,直接体现此图片,
而不必把图片放在服务器上,引用其链接.
用例:base64(’abc.png’) ==> ‘encoded-result’;
则在网页中, <img src=”data:image/png;base64,encoded-result” />
看到下面这个5角星了吗? 右键看源码,就会发现图片是一串字符串
5: base64编码后字节的变化
很容易推算出, 编码后,每6个位变成8个位.
因此,编码后字节约比编码前多33%.
6: base64串结尾的”=”可以去掉吗?
从上面的编码规则可以反推出, 在base64解码的过程中, 要清除掉结尾处的等号,
然后再反查”base64索引与字母对照表”,转换成原始的字节序列.
那么,去掉尾部的等号,并没有丢失原始信息,但结构变得不规范.
解码前是否判断完整性,这取决于你的应用程序.
实测PHP中的base64_decode函数,并不检测尾部的等号是否完整.
原文:http://www.yanshiba.com/archives/638
相关文章推荐
- (转)base64编码是怎么工作的?
- base64编码是怎么工作的?
- base64编码以及url safe base64是怎么工作的?
- base64编码以及url safe base64是怎么工作的?
- base64编码是怎么工作的?
- base64编码以及url safe base64是怎么工作的?
- base64编码是怎么工作的?
- 如何设置[My]Eclipse工作空间的缺省字符编码?新建页面总是ISO-8859-1怎么解决
- Base64编码详解及其变种(解决加号在URL变空格问题)
- openssl学习篇之base64编码、解码
- Base64编码与解码(转)
- Android数据安全之Base64编码
- Base64编码及其作用
- BASE64编码(网络机器人JAVA编程指南学习)
- java base64 编码 解码, HTTP传送解决+号 \n\r 问题,查询处理
- 图片转成base64编码
- 谈谈每天的SEO工作日志怎么写?
- IOS网络笔记--base64编码和MD5加密的使用方法
- Base64与百分号编码相关 - iOS
- 工作能力怎么提高-薪介网