截取文章一部分显示(无损html)
2010-12-01 12:59
211 查看
最近在做一些内容搜索的工作,搜索出来的内容为html格式,列表部分需要显示每项内容的一部分。因为是html格式的内容,直接截取内容的前多少字符显然不合适了。而如果直接去掉所有html格式然后再截取又无法达到想要的效果,再网上搜了一通之后,写下如下代码应该可以满足基本的要求了。(js写的,因为容易调试)
![](http://www.chenjiliang.com/Image/Extension/js.gif)
复制
![](http://www.chenjiliang.com/Image/Save.jpg)
保存
基本思路:
1.绕过标记,取得实际内容字数 ,如需要显示内容前100个字,绕过标记检索,得到第一百个字实际的索引。然后截取此索引前面的字串。
2.根据一得到的字串,得到这个字串中存在的开始标记和结束标记。注:此处的开始标记标识以"<"开通,且下一个字符不为"/"。
3.剔除2中 得到的开始标记中的不需要成对出现的标记。如br,img,hr等。
4.对比经过3处理的开始标记和2中得到的结束标记,没有配成对的在合适的位置为其配对。
此功能没有经过严格的测试,大家若有兴趣可以可以帮忙测试,有更好的想法的也可以回帖讨论。
![](http://www.chenjiliang.com/Image/Extension/js.gif)
复制
![](http://www.chenjiliang.com/Image/Save.jpg)
保存
var br = {}; br.spTags = ["img","br","hr"];/*不需要成对出现的标记*/ br.contain = function(arr,it){ for(var i=0,len=arr.length;i<len;i++){ if(arr[i]==it){ return true; } } return false; } br.subArtc = function(article,worldNum){ var result = []; /*首先截取需要的字串*/ var wcount = 0; var startTags = [],endTags = []; var isInTag = false; for(var i=0,len=article.length;i<len;i++){ var w = article[i]; result.push(w); if(w=="<"){ isInTag = true; } if(!isInTag){ wcount++; if(wcount==worldNum){ break; } } if(w==">"){ isInTag = false; } } /*对字串进行处理*/ var j=0; isInTag = false; var isStartTag = true; var tagTemp = ""; while(j<i){ w = result[j]; if(isInTag){ if(w==">" || w==" " || w=="/"){ isInTag = false; if(isStartTag){ startTags.push(tagTemp); }else{ endTags.push(tagTemp); } tagTemp = ""; } if(isInTag){ tagTemp+=w; } } if(w=="<"){ isInTag = true; if(result[j+1]=="/"){ isStartTag = false; j++; }else{ isStartTag = true; } } j++; } /*剔除img,br等不需要成对出现的标记*/ var newStartTags = []; for(var x=0,len=startTags.length;x<len;x++){ if(!br.contain(br.spTags,startTags[x])){ newStartTags.push(startTags[x]); } } /*添加没有的结束标记*/ var unEndTagsCount = newStartTags.length - endTags.length; while(unEndTagsCount>0){ result.push("<"); result.push("/") result.push(newStartTags[unEndTagsCount-1]); result.push(">"); unEndTagsCount--; } return result.join(""); };
基本思路:
1.绕过标记,取得实际内容字数 ,如需要显示内容前100个字,绕过标记检索,得到第一百个字实际的索引。然后截取此索引前面的字串。
2.根据一得到的字串,得到这个字串中存在的开始标记和结束标记。注:此处的开始标记标识以"<"开通,且下一个字符不为"/"。
3.剔除2中 得到的开始标记中的不需要成对出现的标记。如br,img,hr等。
4.对比经过3处理的开始标记和2中得到的结束标记,没有配成对的在合适的位置为其配对。
此功能没有经过严格的测试,大家若有兴趣可以可以帮忙测试,有更好的想法的也可以回帖讨论。
相关文章推荐
- 截取文章一部分显示(无损html)
- 截取文章一部分显示(无损html)
- 截取html页面的文章内容显示前一部分内容
- javascript 文章截取部分无损html显示实现代码
- C#中HTML文章中截取摘要,可显示图片
- ASP.NET中怎样截取文章标题或者内容的一部分进行显示ASP.NET中怎样截取文章标题或者内容的一部分进行显示
- C#中HTML文章中截取摘要,可显示图片 .
- ASP.NET中怎样截取文章标题或者内容的一部分进行显示
- ASP:截取文章摘要(无损HTML)保留html标签,有待高手完善
- C#中HTML文章中截取摘要,可显示图片
- 把文章里边的html标签去掉(去掉文字的样式,显示css设置的样式)
- smarty中先strip_tags过滤html标签后truncate截取文章运用
- CuteEditor Html中显示Word格式粘贴的文章[CuteEditor WordToHtml]
- 一个按照行来截取显示文章摘要的函数
- C#中HTML文章中截取摘要
- html页面中根据div长度显示标题(截取字符串)
- asp.net文章截取显示摘要 转 荐
- java截取带html标签的字符串,再把标签补全(保证页面显示效果)
- 把文章里边的html标签去掉(去掉文字的样式,显示css设置的样式)