您的位置:首页 > Web前端 > HTML

获取网页标题(htmlparser)

2012-09-27 08:34 211 查看
获取网页标题(htmlparser)

一、通过HtmlPage获取标题

例如:

String htmlcode = "<HTML><HEAD><TITLE>AAA</TITLE></HEAD><BODY>我是中国人!</BODY></HTML>"; //模拟网页基本格式

Parser parser = Parser.createParser(htmlcode, "GBK"); //解析网页

HtmlPage page = new HtmlPage(parser);



parser.visitAllNodesWith(page);



String str=page.getTitle(); //获取标题,此处也可获取body之间的内容,str即为网页的标题

二、通过TitleTag获取标题

ObjectFindingVisitor visitor = new ObjectFindingVisitor(TitleTag.class);

Parser p = new Parser(resourse);

p.setEncoding("gb2312");

p.visitAllNodesWith(visitor);

Node[] nodes= visitor.getTags();



System.out.println(nodes.length);

for (int i = 0; i < nodes.length; i++)

{

// TittleTag

TitleTag tittleLink = (TitleTag) nodes[i]; //转换为titletag

System.out.println("Tittle = " + tittleLink.getTitle()); // 获取title

}

}

或许还会有其他更多的办法,但原理可能是差不多的,都是找到title标签,取出其之间的内容即可。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: