python之爬虫
2016-01-27 10:42
447 查看
一、从网页爬下字符串清除特殊字符
import re def validateTitle(title): rstr = r"[\/\\\:\*\?\"\<\>\|\t]" new_title = re.sub(rstr, "", title) return new_title
说明:如上函数用以过滤/\:*?'<>| 以及table、空格(文件夹、文件名中也尽量不要使用空格)
相关文章推荐
- Python--递归和快速排序 -- quickSort
- python的range()函数用法
- Win7下Python操作MySQL步骤
- Python 列表(list) 总结
- 利用Python抓取和解析网页(转载)
- SDK自动化测试中利用python脚本修改手机系统时间
- Python抓取京东图书评论数据
- Python之控制台输入密码的方法
- python中类变量,成员变量
- python类中self是什么
- Python字典 dict
- Python正则表达式之基础篇
- Python正则表达式之基础篇
- Python图像灰度变换及图像数组操作
- 基于Python实现通过微信搜索功能查看谁把你删除了
- 使用Python写个小监控
- 基于Python如何使用AIML搭建聊天机器人
- Python中文分词—jieba分词
- 用python爬大一波美女妹子
- Python中的单例模式实现