PHP通过正则表达式获取网页中的所有图片
2011-09-30 16:05
519 查看
PHP通过正则表达式获取网页中的所有图片,用到的函数有:file_get_contents() 函数把整个文件读入一个字符串中,preg_match_all函数进行全局正则表达式匹配,array_unique函数去除数组中重复的值
<?php
$url="http://sports.qq.com/photo/?pgv_ref=aio";
//file_get_contents() 函数把整个文件读入一个字符串中
$string=file_get_contents($url);
//preg_match_all函数进行全局正则表达式匹配。
preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/",
$string,$matches);//带引号
//preg_match_all("/<img([^>]*)\ssrc=([^\s>]+)/",$string,$matches);//不带引号
$new_arr=array_unique($matches[0]);//去除数组中重复的值
foreach($new_arr as $key){
echo $key."</br>";
}
?>
代码运行结果将显示所有抓取的图片。
不足之处:如果图片路径不完整,则图片无法显示,所以还需要继续研究下。
<?php
$url="http://sports.qq.com/photo/?pgv_ref=aio";
//file_get_contents() 函数把整个文件读入一个字符串中
$string=file_get_contents($url);
//preg_match_all函数进行全局正则表达式匹配。
preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/",
$string,$matches);//带引号
//preg_match_all("/<img([^>]*)\ssrc=([^\s>]+)/",$string,$matches);//不带引号
$new_arr=array_unique($matches[0]);//去除数组中重复的值
foreach($new_arr as $key){
echo $key."</br>";
}
?>
代码运行结果将显示所有抓取的图片。
不足之处:如果图片路径不完整,则图片无法显示,所以还需要继续研究下。
相关文章推荐
- PHP通过正则表达式获取网页中的所有图片
- PHP通过正则表达式获取网页中的所有图片
- Java中使用正则表达式获取网页中所有图片的路径
- php通过正则从字符串中获取所有图片url地址
- Java中使用正则表达式获取网页中所有图片的路径
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- 正则表达式获取网页中所有图片的路径
- C#通过正则表达式实现提取网页中的图片
- C#正则表达式通过HTML提取网页中的图片src
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- ASP.NET正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- 获取html 中的所有图片 正则表达式
- [转]正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- 正则表达式相关:C# 抓取网页类(获取网页中所有信息)
- php正则表达式获取内容所有链接
- php中通过正则表达式下载内容中的远程图片的函数代码
- C#基于正则表达式实现获取网页中所有信息的网页抓取类实例
- PHP用正则批量替换Img中src内容,用正则表达式获取图片路径实现缩略图功能