c#正则获取html里面a标签href的值
2017-05-09 21:09
567 查看
获取单个a中href的值:
获取多个a中的href的值:
string str = "<a href=\"http://www.itsve.com\">下载</a>"; string reg = @"<a[^>]*href=([""'])?(?<href>[^'""]+)\1[^>]*>"; var item = Regex.Match(str, reg, RegexOptions.IgnoreCase); Console.WriteLine(item.Groups["href"].Value);
获取多个a中的href的值:
string str = "<!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML 1.0 Transitional//EN\" \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\">" + "<html xmlns=\"http://www.w3.org/1999/xhtml\">" + "<head>" + "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\"/>" + "<meta content=\"怎样用c 正则表达式解析HTML中a 超链接 址 .NET技术 ASP.NET\" name=\"Keywords\"/>" + "<meta content=\"是用c 正则表达式 是在后台 不是js正则表达式 是要获取a href属性值\" name=\"description\"/>" + "<title>怎样用c#正则表达式解析HTML中a的超链接地址 - .NET技术 / ASP.NET</title>" + "<li><a href=\"http://news.csdn.net/\" target=\"_blank\">资讯</a>|</li>" + "<li><a href=\"http://mobile.csdn.net/\" target=\"_blank\">移动</a>|</li>" + "<li><a href=\"http://cloud.csdn.net/\" target=\"_blank\">云计算</a>|</li>" + "<link href=\"http://c.csdn.net/bbs/t/5/t5.css\" rel=\"stylesheet\" type=\"text/css\" />" + "<link href=\"http://www.csdn.net/images/favicon.ico\" rel=\"SHORTCUT ICON\" />"; Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""\s]?)(?<href>[^'""\s]*)\1[^>]*?>"); MatchCollection match = reg.Matches(str); foreach (Match m in match) { Response.Write(m.Groups["href"].Value + "<br/>"); }
//C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值,表达式如下: Regex regImg = new Regex(@"(?is)<a[^>]*?href=(['""\s]?)(?<href>([^'""\s]*\.doc)|([^'""\s]*\.docx)|([^'""\s]*\.xls)|([^'""\s]*\.xlsx)|([^'""\s]*\.ppt)|([^'""\s]*\.txt)|([^'""\s]*\.zip)|([^'""\s]*\.rar)|([^'""\s]*\.gz)|([^'""\s]*\.bz2))\1[^>]*?>"
相关文章推荐
- C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值
- C# 正则获取href里面的值
- C#正则表达式提取HTML中IMG标签的SRC地址
- C#正则表达式提取HTML中IMG标签的URL地址 .
- C#获取网页源代码,去除html标签,提取文字源码
- C#用正则表达式 获取网页源代码标签的属性或值
- 【正则表达式】C#正则表达式提取HTML中IMG标签的URL地址
- 牛腩购物9 用户表设计/动软生成器/金钱字段decimal(18, 2)/ 注册的时候的前台js判断/后台代码判断/正则表达式软件/RegexBuddy/设置数据库字段的唯一性约束/如何获取控件在前台html的id值/如何将C#的后台正则换成js的正则
- 正则表达式获取HTML标记中的内容(C#)
- C#用正则表达式 获取标签的属性或值
- C#用正则表达式 获取网页源代码标签的属性或值
- ASP.NET正则替换html标签中img src/href
- C#正则删除HTML标签
- C#去掉html标签正则表达式
- 用C# 正则 提取HTML标签中的值?
- C#运用正则表达式智能获取html模版页中模版信息的应用
- C#去除一段字符串内的HTML标签,正则表达式
- (转)c# .net 使用正则表达式匹配嵌套Html标签
- C#运用正则表达式智能获取html模版页中模版信息的应用
- 正则表达式获取HTML标记中的内容(C#)