MHtmlDomMaster-------Html解析器
2016-07-01 02:49
411 查看
MHtmlDomMaster 0.1
MHTmlDomMaster是Html解析器来的,能用来解析标准的Html网页和一部分不标准的Html网页(不标准的没测试完全-_-!)。配合爬虫可以获取网站的指定信息。呕心沥血(毕竟蚊子多)开发半个月。PHP写的
原创,毕竟第一次写这玩意,手生。
下载地址
https://github.com/M233/MHtmlDomMaster使用模版
<?php //加载php文件 include_once("MHtmlDomMaster.php"); $strHtml=file_get_contents("test.html"); /* $strHtml的值等于下面的Html代码,这段Html代码只是用来讲解用 <html> <head> </head> <body> <div id="div1"> <div class="class1"> <span> span1 </span> <span> span2 </span> </div> <div class="class2"> div class2 </div> </div> <div id="div2"> </div> </body> </html> */ /* * 生成Dom树 */ $objDomMaster=new MHtmlDomMaster($strHtml); /* * 通过ID查找Dom节点 * 返回的是包含符合条件的Dom节点的HtmlItemIterator类 * 如果没找到 则HtmlItemIterator->fn_size()==0 */ $objIteratorDiv=$objDomMaster->fn_find_item_by_id('div1'); /** * 获取HtmlItemIterator包含的HtmlItem中的第0个 * 如果Iterator没有包含HtmlItem,则返回NULL */ $objHtmlItemDiv=$objIteratorDiv->fn_get_item(); /** * HtmlItem 里面的innerHtml */ $strInnerHtml=$objHtmlItemDiv->mStrInnerHtml; /** * 下面输出的结果是 <div class="class1"> <span> span1 </span> <span> span2 </span> </div> <div class="class2"> div class2 </div> */ echo $strInnerHtml; /** * 通过class查找Dom节点 */ $objIteratorDiv=$objDomMaster->fn_find_item_by_class("class1"); /* 下面输出结果是 <span> span1 </span> <span> span2 </span> */ echo $objIteratorDiv->fn_get_item()->mStrInnerHtml; /** * 通过标签名查找Dom节点 * 标签名不区分大小写 */ $objIteratorDiv=$objDomMaster->fn_find_item_by_tag("div"); /** * 支持链式查询 * fn_find_item_by_tag("div")的查询是从上一个fn_find_item_by_class("class1")的查询结果所返回的HtmlItemIterator所包含的HtmlItem中查询 */ $objIteratorSpan=$objDomMaster->fn_find_item_by_class("class1")->fn_find_item_by_tag("span"); /* * 获取HtmlItemIterator中所包含的HtmlItem的第1个(从0开始算) */ $objItemSpan=$objIteratorSpan->fn_get_item(1); /* 下面的输出结果是 span2 */ echo $objItemSpan->mStrInnerHtml; ?>
相关文章推荐
- 一个关于if else容易迷惑的问题
- PHP5.2.*防止Hash冲突拒绝服务攻击的Patch
- 深入理解PHP之匿名函数
- JSP/PHP基于Ajax的分页功能实现
- 关于PHP通过PDO用中文条件查询MySQL的问题。
- 什么是设计模式
- PHP数据库长连接mysql_pconnect的细节
- Php Installing An Expansion
- rem : web app适配的秘密武器
- jquery高级应用之Deferred对象
- php7 读取php.ini[4]
- PHP+Apache在Windows 9x下的安装和配置
- IIS 6 的 PHP 最佳配置方法
- 安装Apache和PHP的一些补充
- Linux Apache+MySQL+PHP
- 建立Apache+PHP+MySQL数据库驱动的动态网站
- PHP 5.3.0 安装分析心得
- apache 环境下 php 的配置注意事项