ios 开发 NSString 正确遍历字符个数方式 (surrogate pairs)
2016-10-14 16:11
316 查看
最近在处理Cocoa NSString时, 遇到一些字符编码的问题, 从而引出一个遍历NSString每一个字符的”正确”方式! 很有趣.
NSString是UTF-16编码的, 也就是16位的unichar字符的序列. 所以, 一般遍历其每一个字符的方法就是:
但是, 我们平常书写的字符, 并不全部都是用唯一的一个16位字符来表示, 而是有一部分用两个16位字符来表示, 这就是surrogate pairs的概念. 如果还是用上面的方法遍历字符串, 就会出现”断字”. 例如图中这个Apple Color Emoji的”THUMBS UP SIGN”字符, 其实是用2个16位unichar来表示, 它的Unicode是U+1F44D, 用(U+D83D U+DC4D)两个字符来表示.
还好, NSString的rangeOfComposedCharacterSequencesForRange:和rangeOfComposedCharacterSequenceAtIndex:两个方法可以用来处理这种情况. 所以, 真正正确的遍历NSString的每一个字符的方法就是这样了:
一次遍历一个子串, 而不是遍历一个unichar了.
NSString是UTF-16编码的, 也就是16位的unichar字符的序列. 所以, 一般遍历其每一个字符的方法就是:
for(int i=0; i<str.length; i++){ unichar ch = [str characterAtIndex: i]; }
但是, 我们平常书写的字符, 并不全部都是用唯一的一个16位字符来表示, 而是有一部分用两个16位字符来表示, 这就是surrogate pairs的概念. 如果还是用上面的方法遍历字符串, 就会出现”断字”. 例如图中这个Apple Color Emoji的”THUMBS UP SIGN”字符, 其实是用2个16位unichar来表示, 它的Unicode是U+1F44D, 用(U+D83D U+DC4D)两个字符来表示.
还好, NSString的rangeOfComposedCharacterSequencesForRange:和rangeOfComposedCharacterSequenceAtIndex:两个方法可以用来处理这种情况. 所以, 真正正确的遍历NSString的每一个字符的方法就是这样了:
NSRange range; for(int i=0; i<str.length; i+=range.length){ range = [str rangeOfComposedCharacterSequenceAtIndex:i]; NSString *s = [str attributedSubstringFromRange:range]; }
一次遍历一个子串, 而不是遍历一个unichar了.
-(NSString *)subStringWith:(NSString *)string ToIndex:(NSInteger)index{ NSString *result = string; if (result.length > index) { NSRange rangeIndex = [result rangeOfComposedCharacterSequenceAtIndex:index]; result = [result substringToIndex:(rangeIndex.location)]; } return result; }
相关文章推荐
- 【iOS开发】判断NSString中的字符是否为中文的正确方法
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- iOS NSString 没有去除首尾空格,换行符,空字符--导致UIlabel不能正确计算换行后的动态高度
- iOS开发 正确选择图片加载方式
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- iOS开发-NSString小拓展-判断是否纯中文-获取字符所占字节
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- iOS开发中数组常用的五种遍历方式
- iOS开发笔记之--NSString 过滤空白字符和换行符
- iOS开发实用技巧—Objective-C中的各种遍历(迭代)方式
- IOS 开发中判断NSString是否为空字符
- [置顶] iOS开发中只NSString截取字符串的几种方式
- iOS开发小技巧--相机相册的正确打开方式
- iOS开发 正确选择图片加载方式
- iOS开发中遍历方式 (有借鉴)