MySQL 中如何存储 emoji ?
2016-08-22 00:00
253 查看
问题还原
使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:
<<240,159,152,134,240,159,152,144>>
查看二进制的 unicode 是什么?
14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>).
[128518,128528]
15> erlang:integer_to_list(128518,16).%%查看十六进制
"1F606"
16> erlang:integer_to_list(128528,16).
"1F610"
明显,1F606 和 1F610 超过了常见 unicode 字符串 0000-FFFF 的表达范围。
1F606 和 1F610 代表什么?
根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。
MySQL 上存储失败的原因
目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8 编码规定了最多只能有 3 个字节,而 emoji 的 unicode 已经超过了 3 个字节,因此 MySQL 的 utf8 无法识别与存储 emoji。
为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 在 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4 个字节,这种编码可以表示 emoji。
另外 utf8mb4 向下兼容 utf8。
解决方案
将 MySQL 中对应的字段改成 utf8mb4 编码:
ALTER TABLE t1
DEFAULT CHARACTER SET utf8mb4,
MODIFY col1 CHAR(10)
MODIFY col2 CHAR(10)
将连接库的连接编码改为 utf8mb4,下面兄弟连(www.lampbrother.net)就以 erlang 的连接库 emysql 为例:
emysql:add_pool(pool,[{size,1},{user,"user"},{password,"password"},{host,"host"},{port,3306},{encoding,utf8mb4}]).
%%或者
emysql:add_pool(pool,1,"user","password","host",3306,undefined, utf8mb4).
为了建表方便,可以修改 my.cnf:
default-character-set=utf8mb4
[mysqld]
character-set-server=utf8mb4
使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:
<<240,159,152,134,240,159,152,144>>
查看二进制的 unicode 是什么?
14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>).
[128518,128528]
15> erlang:integer_to_list(128518,16).%%查看十六进制
"1F606"
16> erlang:integer_to_list(128528,16).
"1F610"
明显,1F606 和 1F610 超过了常见 unicode 字符串 0000-FFFF 的表达范围。
1F606 和 1F610 代表什么?
根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。
MySQL 上存储失败的原因
目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8 编码规定了最多只能有 3 个字节,而 emoji 的 unicode 已经超过了 3 个字节,因此 MySQL 的 utf8 无法识别与存储 emoji。
为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 在 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4 个字节,这种编码可以表示 emoji。
另外 utf8mb4 向下兼容 utf8。
解决方案
将 MySQL 中对应的字段改成 utf8mb4 编码:
ALTER TABLE t1
DEFAULT CHARACTER SET utf8mb4,
MODIFY col1 CHAR(10)
CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL,
MODIFY col2 CHAR(10)
CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL;
将连接库的连接编码改为 utf8mb4,下面兄弟连(www.lampbrother.net)就以 erlang 的连接库 emysql 为例:
emysql:add_pool(pool,[{size,1},{user,"user"},{password,"password"},{host,"host"},{port,3306},{encoding,utf8mb4}]).
%%或者
emysql:add_pool(pool,1,"user","password","host",3306,undefined, utf8mb4).
为了建表方便,可以修改 my.cnf:
服务器字符集
[mysql]default-character-set=utf8mb4
[mysqld]
character-set-server=utf8mb4
相关文章推荐
- MySQL 中如何存储 emoji ?
- 如何使mysql支持emoji存储
- 如何在 MySQL 中存储 emoji ?
- MySQL第三章如何存储和获取数据
- 如何修改mysql表的存储引擎
- 如何在MySQL的存储过程中实现把过程参数用在游标定义的SELECT命令里面作为表名引用
- mysql如何跳出存储过程的执行
- 详细介绍Mysql各种存储引擎的特性以及如何选择存储引擎
- 如何在mysql存储过程中处理select语句返回的多行结果(用游标)
- MySQL 支持 emoji 图标存储
- Mysql各种存储引擎的特性以及如何选择存储引擎
- 让 MySQL 支持 emoji 存储
- 如何修改mysql表的存储引擎
- 如何修改mysql表的存储引擎
- 存储总量达20T的MySQL实例,如何完成迁移?
- Emoji表情图标在iOS与PHP之间通信及MySQL存储
- 如何更改Mysql数据存储的位置
- 如何查看MySQL的当前存储引擎?
- 如何在MySQL存储过程中保留注释
- 如何选择合适的MySQL存储引擎