UnicodeDecodeError: ‘XXX’ codec can’t decode bytes in position 2-5: illegal multibyte sequence
2016-07-05 09:30
417 查看
错误信息:
UnicodeDecodeError: ‘XXX’ codec can’t decode bytes in position 2-5: illegal multibyte sequence
这是因为遇到了非法字符,例如:全角空格往往有多种不同的实现方式,比如\xa3\xa0,或者\xa4\x57,
这些字符,看起来都是全角空格,但它们并不是“合法”的全角空格
真正的全角空格是\xa1\xa1,因此在转码的过程中出现了异常。
而之前在处理新浪微博数据时,遇到了非法空格问题导致无法正确解析数据。
[解决办法]
return strTest
[补充]
默认的参数就是strict,代表遇到非法字符时抛出异常;
如果设置为ignore,则会忽略非法字符;
如果设置为replace,则会用?号取代非法字符;
如果设置为xmlcharrefreplace,则使用XML的字符引用
UnicodeDecodeError: ‘XXX’ codec can’t decode bytes in position 2-5: illegal multibyte sequence
这是因为遇到了非法字符,例如:全角空格往往有多种不同的实现方式,比如\xa3\xa0,或者\xa4\x57,
这些字符,看起来都是全角空格,但它们并不是“合法”的全角空格
真正的全角空格是\xa1\xa1,因此在转码的过程中出现了异常。
而之前在处理新浪微博数据时,遇到了非法空格问题导致无法正确解析数据。
[解决办法]
将获取的字符串strTxt做decode时,指明ignore,会忽略非法字符,
当然对于gbk等编码,处理同样问题的方法是类似的
strTest = strTxt.decode(‘utf-8’, ‘ignore’)return strTest
[补充]
默认的参数就是strict,代表遇到非法字符时抛出异常;
如果设置为ignore,则会忽略非法字符;
如果设置为replace,则会用?号取代非法字符;
如果设置为xmlcharrefreplace,则使用XML的字符引用
相关文章推荐
- iOS App开发中通过UIDevice类获取设备信息的方法
- UIView的setNeedsLayout,layoutIfNeeded,layoutSubviews 方法之间的关系解释
- 动态库、竖屏显示
- Error:Execution failed for task ':clean'. > Unable to delete directory :\build\intermediates
- Autolayout在UITableView中的坑
- UITableView详解
- UIButton详解
- PowerBuilder安装及破解教程
- PAT (Advanced Level) 1101. Quick Sort (25)
- php中使用include(require)嵌套包含文件时的一些注意问题
- PAT (Advanced Level) 1099. Build A Binary Search Tree (30)
- Shortest Distance from All Buildings
- 源码推荐(0705):简仿映客直播App,UITableView右侧索引
- geeksforgeeks@ Sorting Elements of an Array by Frequency (Sort)
- Longest Consecutive Sequence
- HTML标签marquee实现滚动效果
- APUE(5)---标准I/O库 (3)
- JS与HTML结合使用marquee标签实现无缝滚动效果代码
- UIScrollView截取内部内容存入相册
- UIPickerView