您的位置:首页 > 其它

关于正则的一些笔记(长期更新)

2014-02-13 16:32 369 查看
正则表达式,应该都不陌生,但能真正用的熟的估计也没几个了,以下我的一些笔记

以python为主

#!/usr/bin/python
# -*- coding:GBK -*-
import re

#1,获取字符串中的某一段,注意有些字符需要转义
s = '<title>测试标题</title>'
print re.findall(r'\<title>(.*?)\</title>',s)

#2,获取字符串中的数字,会将一行字符串中的分成数组
s='测试标题12,测试标题34测试标题7223'
print re.findall('\d+',s)

#3,获取字符串中匹配且包含自身的
s = '<title>测试标题</title>'
print re.findall("<title.*?\/title>",s);

#4获取Html中的A标签,且target=“_blank”和Href以href="/showcase/开始
s='<a target="_blank" href="/showcase/2263.shtml"></a>'
print re.findall('<a[\\s]+target="_blank"[\\s]+href="/showcase/.*?\/a>',s)

#获取名字为下一页的a标签
s='下一页'
print re.findall('<a.*?下一页',s)

#获取页面所有img标签
print re.findall('<img\s+src="([^"]*)".*?>',s)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: