您的位置:首页 > 编程语言 > PHP开发

关于php抓取页面信息的简单代码

2012-01-16 00:00 531 查看
利用php DOM函数实现简单的单页信息抓取 (在这里尽抓取a标签,功能实现了,但是扩展页链接抓取没有实现,欢迎大家批评指导)
网站推广

<?php

error_reporting(E_ERROR);

$pages = file_get_contents('http://www.php100.com');

//$pages = htmlspecialchars($pages);

$doc = new DOMDocument();

$new_doc = new DOMDocument('1.0', 'utf-8');

$doc->loadhtml($pages);

$dom = $doc->getElementsByTagName('a');

for ($i=0;$i<$dom->length;$i++){

$node = $new_doc->createElement('a',$dom->item($i)->nodeValue);

$newnode = $new_doc->appendChild($node);

$newnode->setAttribute('href',$dom->item($i)->getAttribute('href'));

$newnode->setAttribute('style','display:block;margin-left:30px;');//echo $dom->item($i)->getAttribute('src').'</br>';

}

echo $new_doc->saveHTML();
网站推广

?>
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  网站推广