您的位置:首页 > Web前端 > HTML

org.htmlparser.util.ParserException: Error in opening a connection to ***

2007-11-18 22:43 866 查看
星期六 2007年09月01日

org.htmlparser.util.ParserException: Error in opening a connection to ***

使用HTMLparser时碰到一个错误

org.htmlparser.util.ParserException: Error in opening a connection to

java.io.IOException: Invalid argument

at java.io.WinNTFileSystem.canonicalize0(Native Method)

at java.io.Win32FileSystem.canonicalize(Win32FileSystem.java:396)

at java.io.File.getCanonicalPath(File.java:559)

at org.htmlparser.http.ConnectionManager.openConnection(ConnectionManager.java:774)

at org.htmlparser.Parser.<init>(Parser.java:304)

at org.htmlparser.Parser.<init>(Parser.java:316)

at tentsoft.util.CNLinkInfParser.doCNLinkInfParser(CNLinkInfParser.java:62)

at tentsoft.util.CNLinkInfParser.getCNLinkList(CNLinkInfParser.java:111)

at tentsoft.util.CNLinkInfParser.main(CNLinkInfParser.java:138)

仔细查看源代码,发现是在
myParser = new Parser(htmlBody);这句出错

其中htmlBody是我request到一个网站得到的response,类型为String.
但是报错。
最后通过定义一个方法

/**
* 解析字符串
* @param inputHTML String
* @return Parser
*/
public static Parser createParser(String inputHTML) {
Lexer mLexer = new Lexer(new Page(inputHTML));
return new Parser(mLexer,
new DefaultParserFeedback(DefaultParserFeedback.QUIET));
}

在createParser里面去做new Parser()的。
问题解决。而上面的myParser = new Parser(htmlBody)语句改成myParser = createParser(htmlBody)就行了

下面是HTMLparser相关的资料:
http://www.hexiao.cn/blog/p/aboutHtmlParser.php
http://www.hexiao.cn/blog/p/use_htmlparser_get_urls.php
/article/5203377.html
http://blog.csdn.net/yjboy1982/archive/2007/07/16/1693687.aspx
http://blog.csdn.net/jinxi/archive/2007/01/18/1487017.aspx
http://blog.csdn.net/eqxu/archive/2007/05/29/1629820.aspx
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐