您的位置：首页 > 编程语言 > PHP开发

关于php抓取页面信息的简单代码

2012-01-16 00:00 531 查看

利用php DOM函数实现简单的单页信息抓取（在这里尽抓取a标签，功能实现了，但是扩展页链接抓取没有实现，欢迎大家批评指导）
网站推广

<?php

error_reporting(E_ERROR);

$pages = file_get_contents('http://www.php100.com');

//$pages = htmlspecialchars($pages);

$doc = new DOMDocument();

$new_doc = new DOMDocument('1.0', 'utf-8');

$doc->loadhtml($pages);

$dom = $doc->getElementsByTagName('a');

for ($i=0;$i<$dom->length;$i++){

$node = $new_doc->createElement('a',$dom->item($i)->nodeValue);

$newnode = $new_doc->appendChild($node);

$newnode->setAttribute('href',$dom->item($i)->getAttribute('href'));

$newnode->setAttribute('style','display:block;margin-left:30px;');//echo $dom->item($i)->getAttribute('src').'</br>';

}

echo $new_doc->saveHTML();
网站推广

?>

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 网站推广

相关文章推荐

新的分享

章节导航