做个类似的蜘蛛抓页,抓回的页如何去除html,js,cssj,剩余网页的内容? (转)
2006-01-07 10:11
831 查看
回复人: babyt(阿泰) ( ) 信誉:100 | 2004-12-03 11:13:00 | 得分:0 | |
用这个函数过滤下你抓到的内容看看 <% Function RemoveHTML(strHTML) Dim objRegExp, Match, Matches Set objRegExp = New Regexp objRegExp.IgnoreCase = True objRegExp.Global = True '取闭合的<> objRegExp.Pattern = "<.+?>" '进行匹配 Set Matches = objRegExp.Execute(strHTML) ' 遍历匹配集合,并替换掉匹配的项目 For Each Match in Matches strHtml=Replace(strHTML,Match.Value,"") Next RemoveHTML=strHTML Set objRegExp = Nothing End Function %> | |||
Top | |||
回复人: pswdf(小邪) ( ) 信誉:108 | 2004-12-03 11:30:00 | 得分:0 | |
用正则替换掉就行。 如果是网址,就那一段不要抓。 |
相关文章推荐
- 做个类似的蜘蛛抓页,抓回的页如何去除html,js,cssj,剩余网页的内容?
- js函数获取html中className所在的内容并去除标签
- 如何抓取网页数据、分析并且去除Html标签C#(转载)
- 如何去除html标签得到纯文本内容
- 如何分析网页数据并且去除Html标签(C#)
- 如何给静态html 引用的js或者css路径后面加上时间戳,去除调试的客户端缓存。
- 如何抓取网页数据、分析并且去除Html标签(C#)
- js函数获取html中className所在的内容并去除标签
- 如何管理HTML网页的内容
- 网页特效|网页特效代码(JsHtml.cn)---左右选择添加删除内容菜单
- 如何分析网页数据并且去除Html标签(C#)
- 如何在网页中通过js代码将内容分享到朋友圈?
- 如何分析网页数据并且去除Html标签(C#)
- C#如何抓取网页数据、分析并且去除Html标签
- JS提取网页中表格内容,将特定列内的html文本中id,href,onclick属性提取出来
- 如何抓取执行js之后的网页内容
- 如何用java实现在网页中保存html编辑器 编辑好的 html 文件?!(如blog里发文章的时候把要发表的内容以html文件的形式保存到服务器上?)
- js如何获取html中用户输入到文本框中的内容?
- 如何抓取网页数据、分析并且去除Html标签(C#)
- gprs连接成功以后,如何通过socket获取网页html内容(C#)