破解火车头采集器不能使用随机代理IP的限制
2014-02-25 11:23
471 查看
我们在采集一个目标网站时,为了不让网站管理员发现有人在采集他的网站而封掉我们服务器的IP,这时就需要使用代理IP来间接采集目标网站。但是单一使用某一个代理IP去采集,还是很容易被网站管理员发现而封掉这个代理IP,这就需要使用随机代理IP。我们在使用火车头采集器时,目前在旗舰版以下的所有版本,官方禁止使用【随机代理IP】的功能,其实只要想点办法,就可以实现随机代理IP采集功能。下面做详细介绍:
1、打开火车采集器的一项任务:【文件保存及部分高级设置】,这里有代理IP的设置选项,我们选择“使用IE浏览器代理”
![](https://oscdn.geek-share.com/Uploads/Images/Content/202001/27/24b26cef333123c6314a9eec91e716f9.jpg)
2、设置IE浏览器代理选项: 右键 IE浏览器-属性-连接-局域网设置
![](https://oscdn.geek-share.com/Uploads/Images/Content/202001/27/1f510312831a9d593964811408ffe9bc.jpg)
![](https://oscdn.geek-share.com/Uploads/Images/Content/202001/27/14a9b885d423994f90b487234c86ffb1.jpg)
在“使用自动配置脚本”前打√,并在地址里输入:file://d:/ipcn.pac(这里的路径可以修改,但要注意格式,也可以用http://绝对路径的格式)
3、编辑ipcn.pac文件
在D盘新建记事本文档,打开并输入如下代码保存,最后将文件名改为:ipcn.pac
其中有9组IP地址可以更改成你想要IP的代理地址。
这样在采集目标网站时,就会随机使用这里的代理IP访问目标网站,避免暴露了你服务器的真实IP而被禁止。原创编辑:http://www.520hd.cc 欢迎转载。
1、打开火车采集器的一项任务:【文件保存及部分高级设置】,这里有代理IP的设置选项,我们选择“使用IE浏览器代理”
![](https://oscdn.geek-share.com/Uploads/Images/Content/202001/27/24b26cef333123c6314a9eec91e716f9.jpg)
2、设置IE浏览器代理选项: 右键 IE浏览器-属性-连接-局域网设置
![](https://oscdn.geek-share.com/Uploads/Images/Content/202001/27/1f510312831a9d593964811408ffe9bc.jpg)
![](https://oscdn.geek-share.com/Uploads/Images/Content/202001/27/14a9b885d423994f90b487234c86ffb1.jpg)
在“使用自动配置脚本”前打√,并在地址里输入:file://d:/ipcn.pac(这里的路径可以修改,但要注意格式,也可以用http://绝对路径的格式)
3、编辑ipcn.pac文件
在D盘新建记事本文档,打开并输入如下代码保存,最后将文件名改为:ipcn.pac
function FindProxyForURL(url,host) { return randomProxy(); } function randomProxy() { switch(Math.floor( Math.random() * 9 ))//以下9组代理IP地址根据需要可自行修改 { case 0: return "PROXY 14.18.16.66:80"; break; case 1: return "PROXY 27.24.158.151:80"; break; case 2: return "PROXY 61.174.9.96:8080"; break; case 3: return "PROXY 61.147.82.87:8000"; break; case 4: return "PROXY 14.18.17.166:80"; break; case 5: return "PROXY 61.147.107.18:808"; break; case 6: return "PROXY 59.172.208.189:8080"; break; case 7: return "PROXY 59.172.208.186:8080"; break; case 8: return "PROXY 14.18.16.67:80"; break; } }
其中有9组IP地址可以更改成你想要IP的代理地址。
这样在采集目标网站时,就会随机使用这里的代理IP访问目标网站,避免暴露了你服务器的真实IP而被禁止。原创编辑:http://www.520hd.cc 欢迎转载。
相关文章推荐
- jquery实现停留半秒后再选择
- [转载] Linux Containers 官方指南[英文]
- 一幅图理解android .9.png 格式
- ZOJ 2476 Total Amount
- context.xml
- android用canva写文字,生成bitmap
- 自制处理器OpenMIPS移植ucos-II过程之3——DE2验证OpenMIPS
- 30个SEO推广新站方法
- 多线程死锁分析
- php IE中文乱码
- linux线程同步之信号
- tomcat conf目录下四个文件的作用
- 点击登录按钮弹出登录层(HTML+JS)
- Android OOM ,回收布局文件中ImageView占用的内存.Bitmap OOM回收解决.
- 常见的百度蜘蛛IP 日志分析
- 初学seo速记指南
- 1,2两种类型的砖铺地
- crontab执行PHP
- Js排序
- 二分查找