常见Unicode编码范围
2018-01-17 10:35
344 查看
常见Unicode编码范围
经常我们会用到判断某个字符或者字符串是否包含中文,英文,特殊符号等等。这时候可以通过判断Unicode所在区间来确定某个字符所处类型。当然可以通过直接判断Unicode码,但是鉴于习惯,以下提供的是Unicode码对应的数字区间。毕竟字符的本质也就是通过二进制进行存储编码的而已。汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
数字:[0x30,0x39](或十进制[48, 57])
小写字母:[0x61,0x7a](或十进制[97, 122])
大写字母:[0x41,0x5a](或十进制[65, 90])
其他:除上所有
例如:
/** * 是否包含汉字 */ fun String.isContainChinese(): Boolean { this.forEach { val c = it.toInt() if (c in 19968..40868) { return true } } return false }
【转载】Unicode和ASCII的区别
相关文章推荐
- 中文在unicode中的编码范围
- 三种常见字符编码简介:ASCII、Unicode和UTF-8
- 三种常见字符编码简介:ASCII、Unicode和UTF-8
- 三种常见字符编码简介:ASCII、Unicode和UTF-8
- 密码学之常见编码ASCII、Base64、Unicode、URL、摩尔斯电码等通俗理解
- 中文在unicode中的编码范围
- 三种常见字符编码简介:ASCII、Unicode和UTF-8
- 常见字符编码简介:ASCII、Unicode、UTF-8、UTF16
- Unicode中文和特殊字符的编码范围
- Unicode中文和特殊字符的编码范围
- Qt中用正则表达式来判断Text的语种,主要通过判断unicode的编码范围
- Unicode中文和特殊字符的编码范围
- Unicode中文和特殊字符的编码范围
- 各个国家 不同字符集的unicode 编码范围
- Unicode中文和特殊字符的编码范围 及部分正则
- Unicode中文和特殊字符的编码范围
- Unicode编码的字块,Unicode不同范围对应的不同语言的字符集
- 常见中文的unicode编码的字符串
- 三种常见字符编码简介:ASCII、Unicode和UTF-8
- 三种常见字符编码简介:ASCII、Unicode和UTF-8