utf8的bom
2013-05-21 08:46
155 查看
文章出处:http://hi.baidu.com/bgnwylhzpfbfpzq/item/d4c8c41f44136dddbe9042f1
快下班的时候无意中发现我新装的EditPlus3的保存选项中UTF-8标识选的“总是加入签名”,印象中这个选项是“总是删除签名”,于是尝试着把这个选项改掉,然后把奥运竞猜的程序全部重新另存一遍上传到服务器——OK,页面样式对了。
解决了,但是为何这个“签名”会导致这种问题?万能的Google告诉我:utf-8 是一种在web应用中经常使用的一种 unicode 字符的编码方式,使用 utf-8 的好处在于它是一种变长的编码方式,对于 ANSII 码编码长度为1个字节,这样的话在传输大量 ASCII 字符集的网页时,可以大量节约网络带宽。使用 utf-8 编码来编写网页的时候, 往往会因为 bom (Byte Order Mark) 的问题,导致网页中经常出现一些不明的空行或者乱码字符。 这些都是因为 utf-8 编码方式对于 bom
不是强制的。因此 utf-8 编码在保存文件的时候,会出现不同的处理方式。比如有的浏览器(FireFox)可以自动过滤掉所有 utf-8 bom , 有的 (IE) 只能过滤掉一次 bom (为什么是一次? 当你出现 Include 多次文件时就会碰上这个问题了)。 对此 w3.org 标准 FAQ 中对此问题有一个专门的描述: http://www.w3.org/International/questions/qa-utf8-bom
快下班的时候无意中发现我新装的EditPlus3的保存选项中UTF-8标识选的“总是加入签名”,印象中这个选项是“总是删除签名”,于是尝试着把这个选项改掉,然后把奥运竞猜的程序全部重新另存一遍上传到服务器——OK,页面样式对了。
解决了,但是为何这个“签名”会导致这种问题?万能的Google告诉我:utf-8 是一种在web应用中经常使用的一种 unicode 字符的编码方式,使用 utf-8 的好处在于它是一种变长的编码方式,对于 ANSII 码编码长度为1个字节,这样的话在传输大量 ASCII 字符集的网页时,可以大量节约网络带宽。使用 utf-8 编码来编写网页的时候, 往往会因为 bom (Byte Order Mark) 的问题,导致网页中经常出现一些不明的空行或者乱码字符。 这些都是因为 utf-8 编码方式对于 bom
不是强制的。因此 utf-8 编码在保存文件的时候,会出现不同的处理方式。比如有的浏览器(FireFox)可以自动过滤掉所有 utf-8 bom , 有的 (IE) 只能过滤掉一次 bom (为什么是一次? 当你出现 Include 多次文件时就会碰上这个问题了)。 对此 w3.org 标准 FAQ 中对此问题有一个专门的描述: http://www.w3.org/International/questions/qa-utf8-bom
相关文章推荐
- UTF8 BOM
- SHELL下查找文件中的UTF8 BOM头
- linux下批量删除utf8 bom的实现方法
- utf8+bom格式的文件与接口文件
- UTF8最好不要带BOM,附许多经典评论
- UTF8带BOM和不带BOM(转载)
- 让notepad.exe的utf8不添加BOM
- 去掉utf8 bom (找了好久才找到) 防止UTF-8页面上传服务器, 出现错位之类的错误
- 说说Unicode,UTF8,UTF16,BOM,Big endian,Little endian
- UTF8最好不要带BOM
- php头部空行|utf8头部空行|关于bom以及utf-8的问题
- 利用python将文件转换为utf8 无BOM
- C#保存文件为无BOM的utf8格式
- linux下找出utf8带BOM头的文件
- c语言如何识别无BOM的UTF8文本
- UTF8 BOM与UTF8 无BOM 区别
- Python读取文件,检测文件编码及去除UTF8 BOM
- 生成不带签名(BOM)的UTF8格式的XML
- linux下批量删除utf8 bom
- ACSII,GB2312,GBK,GB18030,Unicode,UTF8,UTF16,UTF32,BOM区别与转换——字符编码最全总结