您的位置:首页 > 编程语言 > PHP开发

PHP实现采集淘宝商品信息

2011-05-11 09:39 507 查看
http://daigou.dayusheji.com/demo.php# http://lang.xp3.biz/index.php/60/s/ 一个采集淘宝商品信息的采集
一个采集淘宝商品信息的采集
一个采集淘宝商品信息的采集,可以采集到商品的名称、价格、发货地点、运费、商家信息、商品描述、、、
写这个,一来是想以后肯定可以用的上,对新手朋友也应该有帮助。在市场信息 采集数据方面应该有帮助,这个文件可以将信息采集出来以excel表格导出,方便统计数据,分析数据用。
对于这个,新手可以看看了,高手就请飘过了、、、  呵呵
下面是源代码:
<?php
header("Content-Type: text/html; charset=gbk");
header("Content-type:application/vnd.ms-excel");
header("Content-Disposition:filename=test.xls");
$url = 'http://search.taobao.com/search?q=210000&s=0#J_FilterTabBar';
$content_str = get_content($url);
$total = get_total($content_str);
$arr = get_tab(get_all($total));
$count_arr = count($arr);
$fff = array_shift($arr);
$count_arr = count($arr);
for($i=0;$i<$count_arr;$i++){
@preg_match('/title="(.*?)"/is',$arr[$i],$title);
@preg_match('/<i>(.*?)</i>/is',$arr[$i],$shoujia);
@preg_match('/shipping">运费:(.*?)</span>/is',$arr[$i],$yunfei);
@preg_match('/place">(.*?)</li>/is',$arr[$i],$diqu);
@preg_match('/sale">最近售出(.*?)件</li>/is',$arr[$i],$sale);
@preg_match('/如实描述</span></a>(.*?)</li>/is',$arr[$i],$miaoshu);
$field[$i]['title'] = $title[1];
$field[$i]['shoujia'] = $shoujia[1];
$field[$i]['yunfei'] = $yunfei[1];
$field[$i]['diqu'] = strip_tags($diqu[1]);
$field[$i]['sale'] = $sale[1];
$field[$i]['miao'] = trim(strip_tags($miaoshu[1]));
}
foreach($field as $key =>$value){
$key  = $key +1;
echo  $key ."t".$value ['title']."t".$value ['shoujia']."t".$value ['yunfei']."t".$value ['diqu']."t".$value['sale']."t".$value ['miao']."tn";
}

function get_content($url){
for($i=0;$i<3;$i++){
$c=@file_get_contents($url);
if(strlen($c)>1000)
break;
}
return $c;
}
function replace_content($content){
@preg_match('/<div id="list:content".*<!-- end list view -->/is',$content,$rs);
$rs[0] = preg_replace("/(data-lazyload-)/i","",$rs[0]);
$rs[0] = preg_replace("/(combine-item)/i","",$rs[0]);
$rs[0] = preg_replace("/(>合并同卖家宝贝</a>)/i","></a>",$rs[0]);
$rs[0] = preg_replace("/(<li class="list-item">)|(<li class="list-item last-item">)|(<li class="list-item" >)/i","<!--# p #--><li class="list-item" >",$rs[0]);
return $rs[0];
} 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息