您的位置:首页 > 其它

此輯 碰到这种码怎么办

2018-03-15 11:17 288 查看
python爬虫爬取网站发现中文字会转成类似这种编码: 此輯重要私人珍藏,涵十九件中國古代及近現代
这是unicode十进制编码。
解决方案:
from HTMLParser import HTMLParser
print HTMLParser().unescape('中国')
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐