您的位置:首页 > 编程语言 > Python开发

python之爬虫

2016-01-27 10:42 447 查看

一、从网页爬下字符串清除特殊字符

import re

def validateTitle(title):
rstr = r"[\/\\\:\*\?\"\<\>\|\t]"
new_title = re.sub(rstr, "", title)
return new_title


说明:如上函数用以过滤/\:*?'<>| 以及table、空格(文件夹、文件名中也尽量不要使用空格)

  
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: