简单数据采集(http://blog.jobbole.com/tag/php/)
2016-09-03 08:52
295 查看
<?php for($i=1;$i<=4;$i++){ $url="http://blog.jobbole.com/tag/php/page/$i/"; $str=file_get_contents($url); $reg='#<div class="post floated-thumb">.*<div id="sidebar" class="grid-4">#isU'; preg_match($reg,$str,$arr); //var_dump($arr);die(); $reg2='#<img src="(.*)" alt="" .* />.*<a target="_blank" class="archive-title" href=".*" title=".*">(.*)</a><br />(.*) · <a href=".*" rel="category tag">.*<span class="excerpt"><p>(.*)</p>.*<span class="read-more">#isU'; preg_match_all($reg2,$arr[0],$data); //var_dump($data);die(); $dsn = "mysql:host=127.0.0.1;dbname=cjlianxi"; $db = new PDO($dsn, 'root', 'root'); foreach($data[1] as $k1=>$v1){ $str=file_get_contents($v1);//获取图片内容 $ext=substr($v1,strrpos($v1,"."));//截取后缀 $filename="images/".time().rand(1000,9999).$ext; file_put_contents($filename,$str);//移入缓存 $sql="insert into exam902(title,content,img,addtime)VALUES ('".$data[2][$k1]."','".$data[4][$k1]."','".$filename."','".$data[3][$k1]."')"; $db->exec($sql); } }
相关文章推荐
- 简单数据采集(http://www.sina.com.cn/)
- http://blog.jobbole.com/category/c-cpp/
- PHP导出MySQL数据库为EXCEL文件格式(.xls)的方法 http://www.kankanblog.com/read.php/144.htm
- 转帖:MTK平台输入法浅析(转自:http://www.study-bbs.com/uhome/space.php?uid=120578&do=blog&id=2363)
- XSBase255 -linux 启动过程描述 引用自http://www.linuxeden.com/forum/blog/index.php?op=ViewArticle&articleId=230&blogId=102509
- 闭合浮动元素超级简单的方法http://www.jluvip.com/blog/article.asp?id=281
- 基于PHP的简单采集数据入库程序【续篇】
- 如何使用github?github简单使用教程(转自http://blog.sina.com.cn/dashanliu)
- 今天开始学PID电机控制,这个作者写得很不错,和大家分享一下~~~ PID控制算法通俗理解 作者:whut_wj 来源:http://blog.eccn.com/space.php?uid=35
- 让IIS6.0全面支持asp+php+jsp最新完整版 http://www.marktip.com/blog/article.asp?id=151
- 编程面试的10大算法概念汇总(译) (blog.jobbole.com)
- http://www.bo-blog.com/index.php?l=zh_tw&mod=skins
- 数据挖掘常用算法及实现(http://bbs.chinakdd.com/forum.php?mod=viewthread&tid=4055&extra=page%3D1)
- php优化(转自http://blog.sina.com.cn/s/blog_59c77e2e0100bqch.html~type=v5_one&label=rela_nextarticle)
- php简单的数据采集
- 【script代码段】通过<script src="http://xxx.com/index.php"></script>中的src属性将服务器断数据传到客户端
- 基于PHP的简单采集数据入库程序
- nginx、fastCGI、php-fpm关系梳理(转载 http://blog.sina.com.cn/s/blog_6df9fbe30102v57y.html)
- 基于PHP的简单采集数据入库程序