获取网页标题(htmlparser)
2012-09-27 08:34
211 查看
获取网页标题(htmlparser)
一、通过HtmlPage获取标题
例如:
String htmlcode = "<HTML><HEAD><TITLE>AAA</TITLE></HEAD><BODY>我是中国人!</BODY></HTML>"; //模拟网页基本格式
Parser parser = Parser.createParser(htmlcode, "GBK"); //解析网页
HtmlPage page = new HtmlPage(parser);
parser.visitAllNodesWith(page);
String str=page.getTitle(); //获取标题,此处也可获取body之间的内容,str即为网页的标题
二、通过TitleTag获取标题
ObjectFindingVisitor visitor = new ObjectFindingVisitor(TitleTag.class);
Parser p = new Parser(resourse);
p.setEncoding("gb2312");
p.visitAllNodesWith(visitor);
Node[] nodes= visitor.getTags();
System.out.println(nodes.length);
for (int i = 0; i < nodes.length; i++)
{
// TittleTag
TitleTag tittleLink = (TitleTag) nodes[i]; //转换为titletag
System.out.println("Tittle = " + tittleLink.getTitle()); // 获取title
}
}
或许还会有其他更多的办法,但原理可能是差不多的,都是找到title标签,取出其之间的内容即可。
一、通过HtmlPage获取标题
例如:
String htmlcode = "<HTML><HEAD><TITLE>AAA</TITLE></HEAD><BODY>我是中国人!</BODY></HTML>"; //模拟网页基本格式
Parser parser = Parser.createParser(htmlcode, "GBK"); //解析网页
HtmlPage page = new HtmlPage(parser);
parser.visitAllNodesWith(page);
String str=page.getTitle(); //获取标题,此处也可获取body之间的内容,str即为网页的标题
二、通过TitleTag获取标题
ObjectFindingVisitor visitor = new ObjectFindingVisitor(TitleTag.class);
Parser p = new Parser(resourse);
p.setEncoding("gb2312");
p.visitAllNodesWith(visitor);
Node[] nodes= visitor.getTags();
System.out.println(nodes.length);
for (int i = 0; i < nodes.length; i++)
{
// TittleTag
TitleTag tittleLink = (TitleTag) nodes[i]; //转换为titletag
System.out.println("Tittle = " + tittleLink.getTitle()); // 获取title
}
}
或许还会有其他更多的办法,但原理可能是差不多的,都是找到title标签,取出其之间的内容即可。
相关文章推荐
- HTMLPARSER 爬取 html网页 获取标题 关键字 内容 url
- Android WebView 获取网页的标题
- Android中WebView获取网页中标题 ,内容, 图片的方法
- 用以获取网页源码并转码的方式。(新闻标题信息采集)
- webview获取网页标题
- PHP CURL或file_get_contents获取网页标题的代码及两者效率的稳定性问题
- UIWebView 获取网页标题
- php获取网页标题和内容函数(不包含html标签)
- ANDROID获取WEBVIEW中网页的TITLE(标题)信息
- 使用HtmlParser获取网页目标数据
- PHP CURL或file_get_contents获取网页标题的代码及两者效率的稳定性问题
- 利用htmlparser解析网页的标题、keywords和Description
- php获取网页标题
- httpclient解析网页,htmlparser获取制定元素
- C# 获取网页标题title的代码
- C#之获取网页标题...
- 利用PHP获取网页的源代码或标题
- javascript 获取网页标题代码实例
- JavaScript获取当前网页标题(title)的方法
- C#之获取网页标题...