您的位置:首页 > 运维架构 > 反向代理

squid配置-cache_peer和cache_peer_domain详解

2013-02-06 11:14 302 查看
acl allowuser
192.168.1.1/32
cache_peer 192.168.1.50 parent 81 0 no-query originserver weight=1 name=a

cache_peer 192.168.1.50 parent 82 0 no-query originserver weight=1 name=b
cache_peer 192.168.1.50 parent 80 0 no-query originserver weight=1
name=c

cache_peer_domain a www.serverA.com
cache_peer_domain b www.serverB.com
cache_peer_domain c www.serverC.com

#以上六行配置表示:

#从客户端过来的请求,如果是 www.serverA.com,则Squid向
Server 192.168.1.50的端口81发送请求;
#从客户端过来的请求,如果是 www.serverB.com,则Squid向
Server 192.168.1.50的端口82发送请求;
#从客户端过来的请求,如果是 www.serverC.com,则Squid向
Server 192.168.1.50的端口80发送请求;
#换句话说:设定不同域名转发到不同的cache_peer上,如果没有这项.不同的域名可能被分发到同一台服务
 器(或同一台服务器的端口)上.

#name=a表示给cache_peer一个别名
 
cache_peer_access a allow all

cache_peer_access b allow all

cache_peer_access c allow all

#设置访问权限,允许所有外部客户端访问 a b c
#如果是cache_peer_access a
allow allowuser
#表示只允许allowuser访问 www.serverA.com
 
 
另一个例子:
acl user1
src 192.168.2.68/32

acl user2 src 192.168.2.94/32
#定义两个user
IP

cache_peer 192.168.2.172 parent 80 0 no-query no-digest originserver name=www1  sourcehash

cache_peer 192.168.2.173 parent 81 0 no-query no-digest originserver name=www2  sourcehash

cache_peer_domain www1 www.domain.com

cache_peer_domain www2 www.domian.com
#表明对www.domian.com的请求,squid向192.168.2.172的80端口和192.168.2.173的81端口发出请求

cache_peer_access
www1 allow user1

cache_peer_access www2 allow user2
#允许user1访问192.168.2.172的80端口
#允许user2访问192.168.2.173的81端口 
 
设置子父代理的cache_peer:

如果要设置父级的代理服务器,例如proxy.test.edu.cn那么可以这样配置

在#cache_peer hostname type 3128 3130 之下加入

cache_peer proxy.test.edu.cn parent 3128 3130 no-query no-netdb-exchange

 

如果要设置同级的代理服务器,如:192.168.1.41 192.168.1.42则可以这样来配置

cache_peer 192.168.1.41 sibling 3128 3130 proxy-only

....

注意目前各单位施行代理服务器分级管理,设置父级代理服务器,还必须取得上层单位的同意

 

说明:

(1)命令cache_peer的定义格式是:

cache_peer hostname type 3128 3130

hostname 是用来指定获取缓冲的PROXY主机的名字

type 是PROXY主机的类型,有以上PARENT SIBLING两种

3128:HTTP_PORT

3130:ICP_PORT

 

(2)附加配置选项(注意应为小写,配置时)

NO-QUERY:不做查询操作,直接获取数据

NO-NETDB-EXCHANGE:代理服务器之间不交互信息

NO-DIGEST:代理服务器之间不做摘要表查询,直接用ICP协议沟通(同级代理)

PROXY-ONLY:直接获取对方缓冲,转交给代理服务器的客户端,而不存入本地

ROUND-ROBIN:如果设置数部上层服务器,那么轮流查询父级服务器

LOGIN=USER:PASSWD:要求对方做帐号及密码验证,例如

cache_peer 192.168.1.41 sibling 3128 3130 login=kao:123456

举例:

以下为squid1机器上的配置

icp_port 3130

acl domian dst www.domian.com

acl squid2 src xx.xx.xx.xx

acl squid3 src xx.xx.xx.xx

http_access allow  squid2

http_access allow  squid3

1.配置 squid2、squid3 为其邻居,当 squid1 在其缓存中没有找到请求的资源时,通过 ICP 查询去其邻居中取得缓存

cache_peer squid2 sibling 80 3130

cache_peer squid3 sibling 80 3130

2.squid1的三个父节点,originserver 参数指明是源服务器,round-robin 参数指明 squid 通过轮询方式将请求分发到其中一台父节点;squid 同时会对这些父节点的健康状态进行检查,如果父节点down了,那么 squid 会从剩余的 origin 服务器中抓取数据。

cache_peer 192.168.1.1 parent 8080 0 no-query originserver round-robin name=www1

cache_peer 192.168.1.2 parent 8080 0 no-query originserver round-robin name=www2

cache_peer 192.168.1.3 parent 8080 0 no-query originserver round-robin name=www3

 

3.将 www.domian.com 域的请求通过 RR 轮询方式转发到三个父节点中的一个。

cache_peer_domain www1 domian

cache_peer_domain www2 domian

cache_peer_domain www3 domian

4.always_direct会导致所有请求都直接发送到原始服务器。而不会去查询sibling,对于www.domian.com这个域名不需要直接出去,而是要询问sibling。其余的域名,squid依然通过hosts去进行转发

always_direct allow !domain

Cache_peer的理解
 
1) cache_peer邻居分为parent(父邻居),sibling(子邻居).parent和sibling的区别在于父邻居能为子cache转发丢失的Cache,而子邻居不可能.

 2) cache_peer通过cache_peer_access和cache_peer_domain来控制邻居的访问.二者的区别在于前者一般需要先定义一个ACL而后者都直接匹配相应的域名就可以了.

  如: 

         cache_peer 192.168.0.1 parent 3128 3130

         acl AllowDomain dst www.abc.com[/u]

         cache_peer_access AllowDomain 192.168.0.1

         cache_peer_domain 192.168.0.1  parent .xyc.com

   

 3) cache_peer通过never_direct,always_direct,hierarchy_stoplist等限制对邻居的访问.

 4) squid与邻居cache的通信一般为先为never_direct,always_direct确定怎么样转发(根据相应的标识driect, never_direct标识为direct_no,always_direct标识为direct_yes即直接转发到原始服务器等等 direct_maybe详情见Squid中文权威指南10.10.1),接着Squid根据Squid的设置查看耕邻居的摘要是否命中(根据ICP或 HCTP的请求所发现的),若命中则立即放入转发列表中.这一切也依靠cache_peer_access,cache_peer_domain的.同时
squid检查netdb侦测的RTT是否最优,决定是否选择此邻居转发.

 5)子邻居不转发任何命中丢失的请求,而父邻居可以转发,若Squid发现父邻居到原始服务器的RTT(往返时间)小于自已到原始服务器的RTT,将此请求转发给此父邻居.(RTT时间需借助Netdb选项的检测,对于父邻居的选择还有另外一些定义选项如:Weigh=N设置父邻居的权重来给予他更高的优先级)

ICP/HCTP和Cache摘要以及CARP一样,都是判断请求的URI是否在邻居中被命中。ICP是发送URL请求,Squid等待着邻居的回应,网络的延迟也是很大的,而且在姐妹Cache中假命中又显得很突出。No-Query,禁用ICP协议! Cache摘要是在邻居中生成摘要信息,摘要往往把反应在Cache中的信息,邻居下载每个Cache中的摘要,发送URI请求时查看URL是否在某个摘要中。

摘录两个 squid.conf 的主要配置,如下

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

$vi etc/squid.conf
http_port 8080

cache_peer 10.10.2.53 parent 6666 7 login=username:password default no-query

cache_mem 60 MB

cache_mgr zdysgs@zju.edu.cn

dns_nameservers 10.10.0.21

visible_hostname zdysgs.zju.edu.cn

cache_dir ufs /usr/local/squid/var/cache 500 16 256

http_access allow all

never_direct allow all

error_directory /usr/local/squid/share/errors/Simplify_Chinese

cache_swap_low 80

cache_swap_high 97      

#这两行是设置cache进行替换的闸值。当占用到97%的cache后,cache中的内容将被清空20%

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
第二个是网上找来的,比较简略,一目了然, 如下
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

一. Squid二级代理
在10.2.1.213上/usr/local/squid安装了 squid-2.5.STABLE7 

将此squid配置成二级代理,上级代理IP:10.1.1.12,端口 3128 

修改squid.conf使之包含类似如下内容: 

cache_peer 10.1.1.12 parent 3128 0 no-query ###定义父代理10.1.1.12,端口3128 

acl all src 0.0.0.0/0.0.0.0 ###acl控制列表 

http_access allow all 

never_direct allow all ###所有请求转发至上级代理 

运行squid: # /usr/local/squid/squid -D 

昨天晚上明辉打电话过来,说访问错误,以前与遇到过,估计不是Squid问题,我很郁闷,正好那天,公司申请的无线上网卡没钱,只能打电话让韩飞看看,他边测试,我边给我说情况,起初确定问题不再Squid,因为出现的是403,而错误页面不是Squid生成的,只得让他赶紧从lvs中移除,等今天早上来公司解决!

早上来到公司立马检查,先查看

1:access_log 

先查看日志,发现是403,而且缓存了403,PURGE还是403!

2:tcpdump

发现数据包没到指定cache_peer,但是别的域名能够正常访问!

3:squid -k debug 

最后修改端口,开启debug 才找到问题

是因为定义了一个cache_peer,但是没有cache_peer_[domain|access] 引用,结果选择Parent的时候,成了FIRST_UP_PARENT,就导致发送错误IP,返回403,而别的域名能够访问是因为正好发送到的IP是源站!

lvs的另外一台机器也正常,分析日志是TCP_MISS:CARP,CARP不了解,也算巧合把!

现在就将故障重现!



1:配置环境

172.16.1.1

C:\WINDOWS\system32\drivers\etc\HOSTS

172.16.1.54        www.ming.com

172.16.1.54        xin.ming.com

172.16.1.54        abxin.ming.com

172.16.1.54    

[root@54 etc]# grep "^cache_peer" /opt/app/squid3/etc/squid.conf

cache_peer 172.16.1.55 parent 80 0 no-query no-digest originserver name=ming

cache_peer 172.16.1.56 parent 80 0 no-query no-digest originserver name=ming_2

cache_peer_domain ming_2 www.ming.com

cache_peer 172.16.1.57 parent 80 0 no-query no-digest originserver name=xin

cache_peer_domain xin xin.ming.com

[root@54 etc]# 

172.16.1.55 和 172.16.1.56

nginx.conf

server {

listen 80; 

deny all;

}   

server {

listen 80; 

server_name www.ming.com;

location / {    

root html;

index index.html index.htm;

}           

}

172.16.1.57

nginx.conf

server {

listen 80; 

deny all;

}   

server {

listen 80; 

server_name xin.ming.com;

location / {    

root html;

index index.html index.htm;

}           

}

2:测试

E:\>curl -I -X GET http://www.ming.com/                                    

HTTP/1.0 200 OK

E:\>curl -I -X GET http://xin.ming.com/
HTTP/1.0 403 Forbidden

3:分析

抓包看到,不论是www.ming.com 还是 xin.ming.com 都匹配到了cache_peer 172.16.1.55 parent 80 0 no-query no-digest originserver name=ming

将cache_peer_domain 修改成cache_peer_access 形式 依旧如此

注释掉 cache_peer 172.16.1.55 parent 80 0 no-query no-digest originserver name=ming 再次测试,已经正确转发!

E:\>curl -I -X GET http://www.ming.com/
HTTP/1.0 200 OK

E:\>curl -I -X GET http://xin.ming.com/                        

HTTP/1.0 200 OK

疑问:

没有使用cache_peer_access cache_peer_domain 引用,不会被匹配的把,就算匹配,也该是优先级最低啊,这样别人可以利用这点攻击,比如 

E:\>curl -I -X GET http://abxin.ming.com/            # 不存在的域名,结果转发了返回403

HTTP/1.0 403 Forbidden                                     # 

试着将cache_peer 172.16.1.55 parent 80 0 no-query no-digest originserver name=ming 放在最后,上面www.ming.com xin.ming.com 能够正常转发,abxin.ming.com 出现403,说明也是转发到1.55 了,也是没必要的,那就只能注释掉才行了!

试着用squid-2.7.STABLE9 测试,发现处理方式一样,看样子只能以后注意了,最可怕的是,知道还有哪些奇怪的方式,已经遇见几个了...

总结: 

感觉Squid有些东西无法控制,有些东西还很混乱,比如cache_peer_domain cache_peer_access 同时使用,就很让人纠结,也许该抽空尝试下varnish了!


Squid代理服务器介绍及相关配置

一、代理服务器的作用
1.通过缓存的方式为用户提供Web访问加速
2.对用户的Web访问进行过滤控制



二、代理服务器分类
1.普通代理服务
即标准的、传统的代理服务
需要客户机在浏览器中指定代理服务器的地址、端口
2.透明代理服务
适用于企业的网关主机(共享接入Internet)中
客户机不需要指定代理服务器地址、端口等信息
需要设置防火墙策略将客户机的Web访问数据转交给代理服务程序处理
3. 反向代理服务
为Internet用户访问企业Web站点提供缓存加速




三、squid 基本配置
1.所需软件包
软件包名:squid-2.6.STABLE6(版本可能不一样)
服务名:squid
主程序:/usr/sbin/squid
配置目录:/etc/squid/
主配置文件:/etc/squid/squid.conf
默认监听端口:TCP 3128
默认访问日志文件:/var/log/squid/access.log
2.主配置文件squid.conf
常用配置项
http_port 3128                         //默认监听端口
cache_mem 64 MB                     //缓存所占的内存空间大小,建议为物理内存的1/4—1/3
maximum_object_size 4096 KB           //最大缓存对象大小
reply_body_max_size 10240000 allow all  //限定最大请求的文件大小 单位是字节 allow al表示允许所有人的请求
access_log /var/log/squid/access.log squid   //访问日志
visible_hostname proxy.test.com        //反向解析自己的ip地址 以获得主机名
cache_dir ufs /var/spool/squid 100 16 256    //定义缓存目录  数据存储格式 缓存到的目录  为缓存目录分配的磁盘空间(MB) 缓存空间的一级子目录个数  二级子目录个数
3.普通代理的相关配置
按照上面的常用配置项修改主配置文件
测试语法
#  squid –k parse
初始化squid缓存目录
#  squid –z
启动squid 服务
#  service squid start
接下来需要在客户机上做相应的代理设置,如下图所示
服务器的地址(192.168.1.1)、端口(3128)








验证代理服务器功能
在客户机的浏览器上访问某个站点(外网测试机ip 218.29.30.29
),网页访问成功后,检查代理服务器的日志文件,应发现客户机的HTTP访问记录
[root@localhost ~]# tail -1 /var/log/squid/access.log
1244386040.208     62 192.168.1.100 TCP_MISS/200 2828 GET http://218.29.30.29/icons/apache_pb2.gif – DIRECT/218.29.30.29 image/gif
检查外网测试机的Web访问日志,应发现进行访问的是代理服务器主机(218.29.30.31),而不是客户机
[root@gw1 ~]# tail -1 /var/log/httpd/access_log
218.29.30.31 – - [16/May/2009:12:39:39 +0800] “GET /icons/apache_pb2.gif HTTP/1.0″ 200 2414 “http://218.29.30.29″ “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322; .NET
CLR 1.0.3705; aff-kingsoft-ciba)”

4.配置透明代理
实现透明代理的基本条件
前提:(1)客户机的Web访问数据要能经过防火墙
(2)代理服务构建在网关(防火墙)主机中
配置要求:(1)代理服务程序能够支持透明代理
(2)设置防火墙规则,将客户机的Web访问数据自动重定向给代理服务程序处理
基本实现步骤
(1)修改squid.conf配置文件,并重新加载该配置
http_port 192.168.10.1:8080 transparent
注意:不要忘了定义规则,因为默认是拒绝所有的。规则可以这样定义:
acl myacl src 192.168.0.0/255.255.255.0
http_access allow myacl
(2)添加iptables规则
# iptables -t nat -I PREROUTING -i eth1 -s 192.168.10.0/24 -p tcp –dport 80 -j REDIRECT –to-ports 8080
(3)客户机浏览器
不需要在浏览器中指定代理服务器的地址、端口
(4)验证透明代理的实施效果
5.配置反向代理
(1)拓扑图:



(2)基本实现步骤
修改squid.conf文件,并重新加载该配置
语法:cache_peer Web服务器地址 服务器类型 http端口 icp端口 [可选项]
http_port  218.29.30.31:80 vhost
cache_peer 192.168.10.7 parent 80 0 originserver weight=5 max-conn=30
cache_peer 192.168.10.8 parent 80 0 originserver weight=5 max-conn=30
cache_peer 192.168.10.9 parent 80 0 originserver weight=5 max-conn=30
cache_peer 192.168.10.6 parent 80 0 originserver weight=1 max-conn=8
(3)验证反向代理的实施效果
在上游Web服务器(192.168.10.6~192.168.10.9)中开启httpd服务
在Internet中的客户机(218.29.30.29)中访问反向代理服务器主机(http://218.29.30.31),应能够看到实际由上游Web服务器提供的网页内容
查看反向代理服务器的访问日志信息
[root@localhost ~]# tail -1  /var/log/squid/access.log
1231256531.038  35 218.29.30.29 TCP_MISS/200 2869 GET http://218.29.30.31/index.php? – FIRST_UP_PARENT/192.168.10.6 image/gif
6. ACL访问控制
(1)ACL(Access Control List,访问控制列表)
可以从客户机的IP地址、请求访问的URL/域名/文件类型、访问时间、并发请求数等各方面进行控制
(2)应用访问控制的方式
定义acl列表
acl 列表名称 列表类型 列表内容 …
常用的acl列表类型
src
dst
port
srcdomain
dstdomain
time
maxconn
url_regex
urlpath_regex
ACL列表定义示例
acl LAN1 src 192.168.10.0/24
acl PC1 src 192.168.10.12/32
acl Blk_Domain dstdomain .qq.com
acl Work_Hours time MTWHF 08:30-17:30
acl Max20_Conn maxconn 20
acl Blk_URL url_regex -i ^rtsp:// ^mms://
acl Blk_Words urlpath_regex -i sex adult
acl RealFile urlpath_regex -i \.rmvb$ \.rm$
针对acl列表进行限制
http_access allow或deny 列表名……
根据已经定义的部分ACL列表进行访问控制
http_access deny LAN1 Blk_URL
http_access deny LAN1 Blk_Words
http_access deny PC1 RealFile
http_access deny PC1 Max20_Conn
http_access allow LAN1 Work_Hours
访问控制规则的匹配顺序
没有设置任何规则时,将拒绝所有客户端的访问请求
有规则但找不到相匹配的项时,将采用与最后一条规则相反的权限,即如果最后一条规则是allow,那么就拒绝客户端的请求,否则允许该请求
转载自:http://zhumeng8337797.blog.163.com/blog/static/10076891420118954728980/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: