Unicode也是一种字符编码方法,容纳65536个字符
2013-01-17 21:35
323 查看
Unicode也是一种字符编码方法,它占用两个字节(0000H—FFFFH),容纳65536个字符,这完全可以容纳全世界所有语言文字的编码。
中国人常用汉字单字个数有多少
这个问题没有准确的答案,只能是在某个范围内的统计数字。国家有关机构作了统计,发布了有关文件。分为常用字表和次常用字表。大约是2500到7000之间。 在社会生活中,不同的行业,部门,不同职业的人所需要的用字量是不同的,在学校教育的不同阶段,也需要规定不同量的识字标准。因此,汉字的字量标准就不能只有一个,而应该有不同的层次和类别。就用字来讲,首先应该区分常用字和通用字。 按现在一般的理解, 常用字就是经常使用的,阅读报刊书籍必须掌握的字,但“经常使用”也只是个模糊的概念,因此在不同的历史时期,根据不同的需要,常用字的概念的内涵也时有变化,即使是同样的内涵,其所收字的数量也会不同。 通用字的范围比常用字大,它是指一定时期出版印刷,辞书编撰和汉字信息处理所需要使用的汉字。现代汉语通用字则是指现代所需要使用的汉字,它不包括很生僻的,专门用于汉语的用字,也不包括专业用字。根据对文字资料的统计,从商朝到现代,一般使用的汉字数量没有显著的变化,可能一直在五六千左右。近年来指定的具有通用字表性质的汉字标准,基本上维持了这一数目。如《印刷通用汉字字形表》收字6196个,国家标准《信息交换用汉字编码字符表》收字6763个。根据近年来实际使用的情况,国家语委在1988年研制的《现代汉语通用字表》,收字7000个。
相关文章推荐
- 匹配括号( ( ),{ },[ ]等左右对应的字符 ) 的一种方法
- 字符串根据多个字符进行分割的一种方法(使用split而不是regex.split更不是replace)
- 写数据库UNICode字符错误解决方法
- 数据结构——线性表——散列存储结构——哈希表知识点总结 原创 2017年05月14日 10:08:40 散列(hashing)是一种重要的存储方法,也是一种常见的查找方法。 基本思想:以结点的
- Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字符都用两个字节表示,即英文字符也是用两个字节表示
- MySQL字符编码的讨论:如何处理emoji等4字节的Unicode字符 - utf8mb4 vs. utf8 Collations
- Hibernate中联合主键映射时有一个也是外键的一种解决方法
- C#中文和UNICODE字符转换方法
- 教你Word2007插入Unicode字符方法
- 我的本科毕业设计(非水文,设计了一个新算法):一种字符编码猜测工具的实现方法
- C#: 中文和UNICODE字符转换方法 及仿安居客地图实现。。。错误 GMap2未定义 解决办法 -VB 中文转为UNICODE字符
- [总结]Perl在遇到Unicode字符文件名时的各种处理方法
- 一种字符编码猜测工具的实现方法
- C#中文和UNICODE字符转换方法
- python Unicode转ascii码的一种方法
- 宽字符和Unicode并不完全等同,Unicode只是宽字符的一种编码方式
- 将字符串按指定字符截断分组的一种方法
- XML 文件中出现 & ? ? 这类特殊字符的一种解决方法
- python的str,unicode对象的encode和decode方法, Python中字符编码的总结和对比bytes和str
- Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字符都用两个字节表示,即英文字符也是用两个字节表示