Mysql字符集|为Mysql选择合适的字符集
2016-06-03 11:15
435 查看
字符集概述
字符集是一套符号和编码的规则,不论是在oracle数据库还是在mysql数据库,都存在字符集的选择问题,而且如果在数据库创建阶段没有正确选择字符集,那么可能在后期需要更换字符集,而字符集的更换是代价比较高的操作,也存在一定的风险,所以,我们推荐在应用开始阶段,就按照需求正确的选择合适的字符集,避免后期不必要的调整。
Mysql支持的字符集简介
mysql服务器可以支持多种字符集(可以用show character set命令查看所有mysql支持的字符集),在同一台服务器、同一个数据库、甚至同一个表的不同字段都可以指定使用不同的字符集,相比oracle等其他数据库管理系统,在同一个数据库只能使用相同的字符集,mysql明显存在更大的灵活性。mysql的字符集包括字符集(CHARACTER)和校对规则(COLLATION)两个概念。字符集是用来定义mysql存储字符串的方式,校对规则则是定义了比较字符串的方式。字符集和校对规则是一对多的关系,
MySQL支持30多种字符集的70多种校对规则。
每个字符集至少对应一个校对规则。可以用SHOW COLLATION LIKE 'utf8%';命令查看相关字符集的校对规则。
Unicode简述
Unicode是一种编码规范。我们在这里简述一下Unicode编码产生的历史。先从ASCII码说起,ASCII码也是一种编码规范,只不过ASCII码只能最多表示256个字符,是针对英文产生的,而面对中文、阿拉伯文之类的复杂文字,256个字符显然是不够用的。于是各个国家或组织都相继制定了符合自己语言文字的标准,比如gb2312、big5等等。但是这种各自制定自己的标准的做法显然是有很多弊端的,于是Unicode编码规范应运而生。
Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode
Character Set"的缩写。
Unicode有两套标准UCS-2和UCS-4,前者用2个字节表示一个字符,后者用4个字节表示一个字符。以目前常用的UCS-2为例,它可以表示的字符数为2^16=65535,基本上可以容纳所有的欧美字符和绝大多数亚洲字符。
怎样选择合适的字符集
我们建议在能够完全满足应用的前提下,尽量使用小的字符集。因为更小的字符集意味着能够节省空间、减少网络传输字节数,同时由于存储空间的较小间接的提高了系统的性能。有很多字符集可以保存汉字,比如utf8、gb2312、gbk、latin1等等,但是常用的是gb2312和gbk。因为gb2312字库比gbk字库小,有些偏僻字(例如:洺)不能保存,因此在选择字符集的时候一定要权衡这些偏僻字在应用出现的几率以及造成的影响,不能做出肯定答复的话最好选用gbk。
Mysql字符集的设置
mysql的字符集和校对规则有4个级别的默认设置:服务器级、数据库级、表级和字段级。分别在不同的地方设置,作用也不相同。服务器字符集和校对,在mysql服务启动的时候确定。可以在my.cnf中设置:
[mysqld]
default-character-set=utf8
或者在启动选项中指定:
mysqld --default-character-set=utf8
或者在编译的时候指定:
./configure --with-charset=utf8
如果没有特别的指定服务器字符集,默认使用latin1作为服务器字符集。上面三种设置的方式都只指定了字符集,没有指定校对规则,这样是使用该字符集默认的校对规则,如果要使用该字符集的非默认校对规则,则需要在指定字符集的同时指定校对规则。
可以用show variables like 'character_set_server';命令查询当前服务器的字符集和校对规则。
相关文章推荐
- 为Mysql选择合适的数据类型
- Mysql各种存储引擎的特性以及如何选择存储引擎
- Mysql安装注意事项、安装失败的五个原因
- mysql 判断表字段或索引是否存在 - 举一反三
- mysql数据库order by语句 null 处理
- 14.2.1 MySQL and the ACID Model
- 14.2.1 MySQL and the ACID Model
- 14.2.1 MySQL and the ACID Model
- MySQL主从复制原理
- mysql The InnoDB memory heap is disabled 问题决解
- 关系型数据库之Mysql引擎-日志-用户管理(三)
- MySQL UPDATE与REPLACE差异
- MySQL数据慢优化
- 从一个MySQL left join优化的例子加深对查询计划的理解
- mysql的审计功能
- mysql自身运行日志文件详解
- Postfix+Courier-Authlib+MySQL+Webmail搭建邮件服
- ubuntu mysql
- Mysql数据库调优和性能优化的21条最佳实践
- mysql自定义函数random_str,产生随机字符串