关于php抓取页面信息的简单代码
2012-01-16 00:00
531 查看
利用php DOM函数实现简单的单页信息抓取 (在这里尽抓取a标签,功能实现了,但是扩展页链接抓取没有实现,欢迎大家批评指导)
网站推广
<?php
error_reporting(E_ERROR);
$pages = file_get_contents('http://www.php100.com');
//$pages = htmlspecialchars($pages);
$doc = new DOMDocument();
$new_doc = new DOMDocument('1.0', 'utf-8');
$doc->loadhtml($pages);
$dom = $doc->getElementsByTagName('a');
for ($i=0;$i<$dom->length;$i++){
$node = $new_doc->createElement('a',$dom->item($i)->nodeValue);
$newnode = $new_doc->appendChild($node);
$newnode->setAttribute('href',$dom->item($i)->getAttribute('href'));
$newnode->setAttribute('style','display:block;margin-left:30px;');//echo $dom->item($i)->getAttribute('src').'</br>';
}
echo $new_doc->saveHTML();
网站推广
?>
网站推广
<?php
error_reporting(E_ERROR);
$pages = file_get_contents('http://www.php100.com');
//$pages = htmlspecialchars($pages);
$doc = new DOMDocument();
$new_doc = new DOMDocument('1.0', 'utf-8');
$doc->loadhtml($pages);
$dom = $doc->getElementsByTagName('a');
for ($i=0;$i<$dom->length;$i++){
$node = $new_doc->createElement('a',$dom->item($i)->nodeValue);
$newnode = $new_doc->appendChild($node);
$newnode->setAttribute('href',$dom->item($i)->getAttribute('href'));
$newnode->setAttribute('style','display:block;margin-left:30px;');//echo $dom->item($i)->getAttribute('src').'</br>';
}
echo $new_doc->saveHTML();
网站推广
?>
相关文章推荐
- 关于php抓取页面信息的简单代码
- PHP抓取页面生成HTMl文件简单代码
- 简单的PHP伪缓存并定时抓取某页面内容
- php的curl扩展抓取信息——模拟登陆成功却无法抓取页面等问题
- 在worldpress中使用php代码抓取图书馆书籍信息
- 爬虫requests库简单抓取页面信息功能实现(Python)
- UCHome中关于公共函数(function_common.php)页面的代码分析(一)
- php编写的简单页面跳转功能实现代码
- Python3抓取页面信息,网络编程,简单发送QQ邮件
- 在worldpress中使用php代码抓取图书馆书籍信息
- PHP分多步骤填写发布信息的简单方法实例代码
- php抓取页面与代码解析 推荐
- 豆瓣2100部动漫页面的网页源码(包括评分,导演,类型,简介等信息,附抓取代码)
- php 论坛采集程序 模拟登陆,抓取页面 实现代码
- UCHome中关于公共函数(function_common.php)页面的代码分析(二)
- PHP分多步骤填写发布信息的简单方法实例代码
- python抓取招聘信息简单代码
- php抓取页面与代码解析 推荐
- php 实现信息采集(网页内容抓取)程序代码
- 使用Struts2关于页面信息国际化(简单的)