用正则获得指定标签的内容
2010-11-03 12:49
148 查看
有如下代码:
要求匹配item里的title而不匹配channel里的title。
基本正则:
首先是title标签,内容为任意字符若干个,然后是title结束标签。这个正则已经能匹配到所有的title标签。
首先,我简单地修改了一下原正则:
因为title里面不应该再嵌有其它标签,这个正则同样是匹配所有标题的内容,最后再加上不去匹配channel中的title。整个正则如下:
(?!\s*<\/channel>)表示要匹配字符串的后面不能跟着若干个空格和一个channel的结束标签。本文出自 “小鬼家家” 博客,谢绝转载!
<channel> <title>蓝色理想</title> </channel> <item> <title>界面设计测试规范</title> </item> <item> <title>《古典写实美女》漫画教程</title> </item> <item> <title>安远――消失的光年</title> </item> <item> <title>asp.net 2.0多语言网站解决方案</title> </item>
要求匹配item里的title而不匹配channel里的title。
基本正则:
/<title>[\s\S]*?<\/title>/gi
首先是title标签,内容为任意字符若干个,然后是title结束标签。这个正则已经能匹配到所有的title标签。
首先,我简单地修改了一下原正则:
/<title>[^<>]*?<\/title>/gi,
因为title里面不应该再嵌有其它标签,这个正则同样是匹配所有标题的内容,最后再加上不去匹配channel中的title。整个正则如下:
/<title>[^<>]*?<\/title>(?!\s*<\/channel>)/gi
(?!\s*<\/channel>)表示要匹配字符串的后面不能跟着若干个空格和一个channel的结束标签。本文出自 “小鬼家家” 博客,谢绝转载!
相关文章推荐
- 用正则表达式替换指定标签中的内容
- C# 正则表达式获取指定标签的内容
- 获得指定网址指定标签内的内容或代码
- 微博内容正则表达式匹配链接, 话题标签与@用户
- python爬虫正则匹配td标签中的内容,以及一些常用的正则
- [python]根据正则表达式提取指定的内容
- sax解析 得到xml文档所有内容和获取指定标签的值
- 正则获取HTML标签内的内容
- python 根据正则表达式提取指定的内容实例详解
- [转]:在oracle中通过utl_http获得指定网页内容,支持中文
- c#在指定内容中通过正则查找字符
- 正则获取指定字符前面全部或后面全部内容
- jaxp dom-getElementsByTagName xml中得到指定名字的所有标签的文本内容
- 微博内容正则表达式匹配链接, 话题标签与@用户
- c++删除指定字符串之间的内容(比正则表达式快几十倍)[转]
- 正则表达式提取指定内容
- php 根据标签的属性值来爬取内容的正则表达式
- C# 获取指定HTML网页中的标签内容
- dedeCMS中的标签"channelartlist” 来获得频道的下级栏目的内容列表
- php正则选择某个值的标签内容