您的位置:首页 > Web前端 > JavaScript

牧佑---oneonezeroDream---jsoup解析html

2017-08-21 23:01 190 查看
有一段不规则的html 文字需要解析,其实很简单的一个问题

从网上下载一个jsoup,jar包。然后就是干

package webDemo;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

public class DeadLockMarker {
public static void main(String[] args) {
String sdf = "<divstyle=\"line-height:1.7;color:#000000;font-size:14px;font-family:Arial\"><br/><br/><br/><br/><br/><divstyle=\"position:relative;zoom:1\"></div><div id=\"divNeteaseMailCard\"></div><br/><divid=\"isForwardContent\">--------转发邮件信息--------<br/>发件人:\"柳州丹顺机械有限公司\"lt;liuzhoudanshun@163.comgt;<br/>发送日期:2017-07-2511:29:22<br/>收件人:lfzhilianglt;lfzhiliang@163.comgt;<br/>主题:Re:供应商质量例会会议纪要2017-7-18(2)<br/><divstyle=\"line-height:1.7;color:#000000;font-size:14px;font-family:Arial\"><br/><br/><br/><br/><br/><divstyle=\"position:relative;zoom:1\"></div><div></div><br/>在2017-07-2116:15:04,\"lfzhiliang\"lt;<ahref=\"mailto:lfzhiliang@163.com \r\n" +
"\r\n" +
"\">lfzhiliang@163.com</a>gt;写道:<br/><blockquoteid=\"isReplyContent\"style=\"PADDING-LEFT:1ex;MARGIN:0px0px0px0.8ex;BORDER-LEFT:#ccc1pxsolid\"><styletype=\"text/css\">BLOCKQUOTE{margin-Top:0px;margin-Bottom:0px;margin-Left:2em}</style><styletype=\"text/css\">body{border-width:0;margin:0}img{border:0;margin:0;padding:0}</style><stationery><div></div><div>各供应商:</div><div>以上是7月份质量例会会议纪要,请按纪要要求,开展相关工作。8月10日前,把相关工作完成情况证据,插入会议纪要回复到该邮箱。</div><div>柳福技术质量部</div><div>&p;柳福技术质量部</div><div>&\r\n" +

"";
String sf =DeadLockMarker.getTextContentHtml(sdf);
System.out.println(sf);
}
public static String getTextContentHtml(String htmlConter) {
/*Document parse = Jsoup.parse(htmlConter);
String text = parse.text();
StringBuilder sb = new StringBuilder(text);
int index =0;
while(sb.length()>index)
{

char tmp = sb.charAt(index);
if(Character.isSpaceChar(tmp) || Character.isWhitespace(tmp))
{
sb.setCharAt(index, ' ');
}
index++;
text = sb.toString().replaceAll(" +","").trim();

}
return text;*/
return Jsoup.parse(htmlConter).text();
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: