jsoup教程002-解析和遍历一个html文档
2017-10-30 11:26
453 查看
jsoup教程002-解析和遍历一个html文档
如何解析一个HTML文档:
其解析器能够尽最大可能从你提供的HTML文档来创见一个干净的解析结果,无论HTML的格式是否完整。比如它可以处理:
没有关闭的标签 (比如:
隐式标签 (比如. 它可以自动将
创建可靠的文档结构(html标签包含head 和 body,在head只出现恰当的元素)
其继承结构如下:Document继承Element继承Node.TextNode继承Node.
一个Element包含一个子节点集合,并拥有一个父Element。他们还提供了一个唯一的子元素过滤列表。
如何解析一个HTML文档:
String html = "<html><head><title>First parse</title></head>"+ "<body><p>Parsed HTML into a doc.</p></body></html>"; Document doc = Jsoup.parse(html);
其解析器能够尽最大可能从你提供的HTML文档来创见一个干净的解析结果,无论HTML的格式是否完整。比如它可以处理:
没有关闭的标签 (比如:
<p>Lorem <p>Ipsumparses to
<p>Lorem</p> <p>Ipsum</p>)
隐式标签 (比如. 它可以自动将
<td>Table data</td>包装成
<table><tr><td>?)
创建可靠的文档结构(html标签包含head 和 body,在head只出现恰当的元素)
一个文档的对象模型
文档由多个Elements和TextNodes组成 (以及其它辅助nodes:详细:nodes package tree.)Hierarchy For Package org.jsoup.nodes Package Hierarchies: All Packages Class Hierarchy java.lang.Object org.jsoup.nodes.Attribute (implements java.lang.Cloneable, java.util.Map.Entry<K,V>) org.jsoup.nodes.BooleanAttribute org.jsoup.nodes.Attributes (implements java.lang.Cloneable, java.lang.Iterable<T>) org.jsoup.nodes.Document.OutputSettings (implements java.lang.Cloneable) org.jsoup.nodes.Entities org.jsoup.nodes.Node (implements java.lang.Cloneable) org.jsoup.nodes.Comment org.jsoup.nodes.DataNode org.jsoup.nodes.DocumentType org.jsoup.nodes.Element org.jsoup.nodes.Document org.jsoup.nodes.FormElement org.jsoup.nodes.TextNode org.jsoup.nodes.XmlDeclaration Enum Hierarchy java.lang.Object java.lang.Enum<E> (implements java.lang.Comparable<T>, java.io.Serializable) org.jsoup.nodes.Entities.EscapeMode org.jsoup.nodes.Document.OutputSettings.Syntax org.jsoup.nodes.Document.QuirksMode
其继承结构如下:Document继承Element继承Node.TextNode继承Node.
一个Element包含一个子节点集合,并拥有一个父Element。他们还提供了一个唯一的子元素过滤列表。
相关文章推荐
- jsoup官方解析和遍历一个HTML文档
- Jsoup入门-解析和遍历一个html文档
- 【Jsoup学习礼记】解析和遍历一个HTML文档
- 【使用JSOUP实现网络爬虫】入门:解析和遍历一个HTML文档
- 【使用JSOUP实现网络爬虫】入门:解析和遍历一个HTML文档
- jsoup教程006-使用DOM方法来遍历一个文档
- JSOUP实践:解析和遍历HTML文档
- JSOUP实践:解析和遍历HTML文档
- JAVA大字符串存储采用静态HTML,通过jsoup 对 HTML 文档进行解析和操作
- 庆祝新版-使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- Jsoup解析HTML实例及文档方法详解
- Jsoup解析HTML实例及文档方法详解
- 【使用JSOUP实现网络爬虫】解析一个HTML字符串
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- [置顶] 使用 jsoup 对 HTML 文档进行解析和操作
- [翻译][Nokogiri官方教程] 解析HTML/XML文档 / Parsing an HTML/XML Document
- 使用 jsoup 对 HTML 文档进行解析和操作(转)