为Vim设置多字符编码方式支持
2013-03-13 10:33
260 查看
和所有的流行文本编辑器一样,Vim 可以很好的编辑各种字符编码的文件,这当然包括UCS-2、UTF-8 等流行的 Unicode 编码方式。
我们来看看 Vim 的多字符编码方式支持是如何工作的。
1. Vim 启动,根据 .vimrc (在windows中是_vimrc)中设置的 encoding 的值来设置缓冲区、菜单文本、消息文本的字符编码方式。
2. 读取需要编辑的文件,根据 fileencodings 中列出的字符编码方式逐一探测该文件编码方式。并设置 fileencoding 为探测到的、看起来是正确的字符编码方式。
3. 对比 fileencoding 和 encoding 的值,若不同则调用 iconv 将文件内容转换为encoding 所描述的字符编码方式,并且把转换后的内容放到为此文件开辟的 buffer 里,此时我们就可以开始编辑这个文件了。注意,完成这一步动作需要调用外部的 iconv.dll,你需要保证这个文件存在于 $VIMRUNTIME 或者其他列在 PATH 环境变量中的目录里。
4. 编辑完成后保存文件时,再次对比 fileencoding 和 encoding 的值。若不同,再次调用 iconv 将即将保存的 buffer 中的文本转换为 fileencoding 所描述的字符编码方式,并保存到指定的文件中。同样,这需要调用 iconv.dll。由于 Unicode 能够包含几乎所有的语言的字符,而且 Unicode 的 UTF-8 编码方式又是非常具有性价比的编码方式 (空间消耗比 UCS-2 小),因此建议 encoding 的值设置为utf-8。这么做的另一个理由是 encoding
设置为 utf-8 时,Vim 自动探测文件的编码方式会更准确 (或许这个理由才是主要的 ;)。我们在中文 Windows 里编辑的文件,为了兼顾与其他软件的兼容性,文件编码还是设置为 GB2312/GBK 比较合适,因此 fileencoding 建议设置为 chinese (chinese 是个别名,在 Unix 里表示 gb2312,在 Windows 里表示cp936,也就是 GBK 的代码页,For MS-Windows "cp{number}" means using codepage {number}.)。
查看文件的编码:
Vim 有四个跟字符编码方式有关的选项,encoding、fileencoding、fileencodings、termencoding (这些选项可能的取值请参考 Vim 在线帮助 :help encoding-names),它们的意义如下:
encoding: Vim 内部使用的字符编码方式,包括 Vim 的 buffer (缓冲区)、菜单文本、消息文本等。你可以用另外一种编码来编辑和保存文件,如你的vim的encoding为utf-8,所编辑的文件采用cp936编码,vim会自动将读入的文件转成utf-8(vim的能读懂的方式),而当你写入文件时,又会自动转回成cp936(文件的保存编码)。
fileencoding: Vim 中当前编辑的文件的字符编码方式,Vim 保存文件时也会将文件保存为这种字符编码方式 (不管是否新文件都如此)。
fileencodings: Vim 启动时会按照它所列出的字符编码方式逐一探测即将打开的文件的字符编码方式,并且将 fileencoding 设置为最终探测到的字符编码方式。因此最好将 Unicode 编码方式放到这个列表的最前面,将拉丁语系编码方式 latin1 放到最后面。
termencoding: Vim 所工作的终端 (或者 Windows 的 Console 窗口) 的字符编码方式。这个选项在 Windows 下对我们常用的 GUI 模式的 gVim 无效,而对 Console 模式的 Vim 而言就是 Windows 控制台的代码页,并且通常我们不需要改变它。
用英文菜单和提示最好,可以免去下面对菜单和提示信息(B,C部分)的设置
如果用英文菜单和提示在安装gvim的时候,将支持本地语言的选项去掉。
解决vim文件乱码,打开文件乱码,vim菜单和提示信息乱码, 有四个跟字符编码方式有关的选项,分别是encoding、fileencoding、fileencodings、termencoding。
我们需要在linux中修改.vimrc文件(在windows中是_vimrc)来进行设置。
windows系统也可以在vim菜单项中:编辑>启动设定,即直接打开_vimrc文件
A,
B,
C,
参考自:http://www.ac.net.blog.163.com/blog/static/13649056201112041417651/
http://www.douban.com/note/145491549/ http://coolshell.cn/articles/5426.html http://yannesposito.com/Scratch/en/blog/Learn-Vim-Progressively/
我们来看看 Vim 的多字符编码方式支持是如何工作的。
1. Vim 启动,根据 .vimrc (在windows中是_vimrc)中设置的 encoding 的值来设置缓冲区、菜单文本、消息文本的字符编码方式。
2. 读取需要编辑的文件,根据 fileencodings 中列出的字符编码方式逐一探测该文件编码方式。并设置 fileencoding 为探测到的、看起来是正确的字符编码方式。
3. 对比 fileencoding 和 encoding 的值,若不同则调用 iconv 将文件内容转换为encoding 所描述的字符编码方式,并且把转换后的内容放到为此文件开辟的 buffer 里,此时我们就可以开始编辑这个文件了。注意,完成这一步动作需要调用外部的 iconv.dll,你需要保证这个文件存在于 $VIMRUNTIME 或者其他列在 PATH 环境变量中的目录里。
4. 编辑完成后保存文件时,再次对比 fileencoding 和 encoding 的值。若不同,再次调用 iconv 将即将保存的 buffer 中的文本转换为 fileencoding 所描述的字符编码方式,并保存到指定的文件中。同样,这需要调用 iconv.dll。由于 Unicode 能够包含几乎所有的语言的字符,而且 Unicode 的 UTF-8 编码方式又是非常具有性价比的编码方式 (空间消耗比 UCS-2 小),因此建议 encoding 的值设置为utf-8。这么做的另一个理由是 encoding
设置为 utf-8 时,Vim 自动探测文件的编码方式会更准确 (或许这个理由才是主要的 ;)。我们在中文 Windows 里编辑的文件,为了兼顾与其他软件的兼容性,文件编码还是设置为 GB2312/GBK 比较合适,因此 fileencoding 建议设置为 chinese (chinese 是个别名,在 Unix 里表示 gb2312,在 Windows 里表示cp936,也就是 GBK 的代码页,For MS-Windows "cp{number}" means using codepage {number}.)。
查看文件的编码:
:echo &fileencoding
Vim 有四个跟字符编码方式有关的选项,encoding、fileencoding、fileencodings、termencoding (这些选项可能的取值请参考 Vim 在线帮助 :help encoding-names),它们的意义如下:
encoding: Vim 内部使用的字符编码方式,包括 Vim 的 buffer (缓冲区)、菜单文本、消息文本等。你可以用另外一种编码来编辑和保存文件,如你的vim的encoding为utf-8,所编辑的文件采用cp936编码,vim会自动将读入的文件转成utf-8(vim的能读懂的方式),而当你写入文件时,又会自动转回成cp936(文件的保存编码)。
fileencoding: Vim 中当前编辑的文件的字符编码方式,Vim 保存文件时也会将文件保存为这种字符编码方式 (不管是否新文件都如此)。
fileencodings: Vim 启动时会按照它所列出的字符编码方式逐一探测即将打开的文件的字符编码方式,并且将 fileencoding 设置为最终探测到的字符编码方式。因此最好将 Unicode 编码方式放到这个列表的最前面,将拉丁语系编码方式 latin1 放到最后面。
termencoding: Vim 所工作的终端 (或者 Windows 的 Console 窗口) 的字符编码方式。这个选项在 Windows 下对我们常用的 GUI 模式的 gVim 无效,而对 Console 模式的 Vim 而言就是 Windows 控制台的代码页,并且通常我们不需要改变它。
用英文菜单和提示最好,可以免去下面对菜单和提示信息(B,C部分)的设置
如果用英文菜单和提示在安装gvim的时候,将支持本地语言的选项去掉。
解决vim文件乱码,打开文件乱码,vim菜单和提示信息乱码, 有四个跟字符编码方式有关的选项,分别是encoding、fileencoding、fileencodings、termencoding。
我们需要在linux中修改.vimrc文件(在windows中是_vimrc)来进行设置。
windows系统也可以在vim菜单项中:编辑>启动设定,即直接打开_vimrc文件
A,
"设置文件的代码形式 set encoding=utf-8 set termencoding=utf-8 set fileencoding=utf-8 set fileencodings=ucs-bom,utf-8,chinese
B,
"vim的菜单乱码解决: "同样在 _vimrc文件里以上的中文设置后加上下列命令, source $VIMRUNTIME/delmenu.vim source $VIMRUNTIME/menu.vim
C,
"vim的提示信息乱码解决 language messages zh_CN.utf-8
参考自:http://www.ac.net.blog.163.com/blog/static/13649056201112041417651/
http://www.douban.com/note/145491549/ http://coolshell.cn/articles/5426.html http://yannesposito.com/Scratch/en/blog/Learn-Vim-Progressively/
相关文章推荐
- [转]Vim打开中文文件乱码 Vim有四个跟字符编码方式有关的选项,encoding、fileencoding、fileencodings、termencoding(这些选项设置请参考Vim文档中e
- Vim设置支持鼠标,光标定位,滚轮上下移动
- vim编码方式的设置
- win2003和win7下设置服务器支持flv,f4v,mp4的方式
- vim 设置支持鼠标
- JSP页面中,二处的字符编码有何区别及response 3 种设置编码的方式
- VIM中字符编码的设置
- 正确设置 Vim 的字符编码选项 (gVim/Vim on Win32 中文环境)
- vim 设置编码方式
- vim 编码方式的设置
- VIM设置---支持鼠标进行光标定位,上下滚动
- Vim设置支持鼠标,光标定位,滚轮上下移动
- vim 编码方式的设置
- vim设置对齐方式
- 中文乱码问题 ? 原因:JSP中默认使用iso-8859-1字符编码方式,不支持中文 ? 常见的支持中文的编码方式:gb2312(常用简体汉字)、gbk(简体和繁体汉字)、utf-8 ? 解决中文乱码
- Filter多方式拦截、禁用IE图片缓存、Filter设置字符编码
- vim设置支持鼠标,光标定位,滚轮上下移动
- 桌面支持-设置adobe为默认pdf阅读软件方式
- proxool 最简单的设置mysql 支持 中文的方式
- Alert--兼容iOS7及以上的AlertView,支持设置对齐方式,支持设置行间距