Nginx+PHP+MySQL双机互备、全自动切换方案
2013-12-13 14:12
561 查看
在生产应用中,某台“Nginx+PHP+MySQL”接口数据服务器,扮演的角色十分重要,如果服务器硬件或Nginx、MySQL发生故障,而短时间内无法恢复,后果将非常严重。为了避免单点故障,我设计了此套方案,编写了failover.sh脚本,实现了双机互备、全自动切换,故障转移时间只需几十秒。
2、解释:
(1)、假设外网域名blog.s135.com解析到外网虚拟IP 72.249.146.214上,内网hosts设置db10对应内网虚拟IP 192.168.146.214
(2)、默认情况下,由主机绑定内、外网虚拟IP,备机作为备份,当主机的MySQL、Nginx或服务器出现故障无法访问时,备机会自动接管内、外网虚拟IP。两台服务器都启动负责监控、自动切换虚拟IP的守护进程/usr/bin/nohup /bin/sh /usr/local/webserver/failover/failover.sh 2>&1 > /dev/null &
(3)、主机和备机上的MySQL服务器互为主从,互相同步。在主机处于活动状态(即由主机绑定虚拟IP)时,读写主机的MySQL,写到主机的数据会同步到备机;在备机处于活动状态时,读写备机的MySQL,写到备机的数据会同步到主机(如果主机上的MySQL死掉暂时无法同步,主机上的MySQL恢复后,数据会自动从备机上同步过来,反之亦然)。
(4)、主机处于活动状态时,每20秒会把/data0/htdocs/(网页、程序、图片存放目录)、/usr/local/webserver/php/etc/(php.ini等配置文件目录)、/usr/local/webserver/nginx/conf/(Nginx配置文件目录)三个目录下的文件通过rsync推送到备机服务器上的对应目录(增量推送,两台服务器上一样的文件不会重复推送),反之如果备机处于活动状态时,每20秒会尝试把文件推送到主机。rsync的配置文件见两台服务器的/etc/rsyncd.conf,rsync守护进程的启动命令为rsync
--daemon
3、自动切换流程
(1)、主机默认绑定内、外网虚拟IP,当主机的MySQL、Nginx无法访问或服务器宕机,主机上的failover.sh守护进程会自动摘除自己绑定的内、外网虚拟IP(如果主机上的failover.sh死掉,无法摘除自己绑定的虚拟IP也没关系),备机上的failover.sh守护进程会自动接管备机原来绑定的内、外网虚拟IP,并发送ARPing包给内、外网网关更新MAC,强行接管。
(2)、备机绑定虚拟IP后,会发送ARPing包给内、外网网关,通知网关更新虚拟IP的MAC地址为备机的MAC地址,从而保证了切换后能够通过虚拟IP及时访问到备机。
(3)、如果主机的MySQL、Nginx启动起来,全部恢复正常访问,主机上的failover.sh守护进程会检测主机上的MySQL数据是否已经完全从备机上同步过来。如果同步延迟时间为0,主机会自动接管内、外网虚拟IP,并发送ARPing包给内、外网网关,而备机也会自动摘除内、外网虚拟IP。
(4)、整个切换流程均由failover.sh自动完成,无需人工处理。
4、注意事项(很重要):
(1)、crontab里的文件没有做自动同步,如果修改,需要手工在两台服务器上都做修改。
(2)、/data0/htdocs/目录内任何用ln -s建立的软连接,rsync不会自动同步,如果在一台服务器上建了软连接,需要手工在另外一台服务器上也建相同的软连接。
(3)、如果要删除/data0/htdocs/目录内的某些文件或目录,需要先删除处于活动状态(即绑定了虚拟IP)服务器上的文件或目录,再删除处于备用状态服务器上的文件或目录。
(4)、除了/data0/htdocs/(网页、程序、图片存放目录)、/usr/local/webserver/php/etc/(php.ini等配置文件目录)、/usr/local/webserver/nginx/conf/(Nginx配置文件目录)三个目录之外的其他配置修改,需要在两台服务器上都做修改。
二、配置文档与脚本:
1、主机、备机两台服务器的rsync配置(配置相同)
(1)、rsync配置文件
(2)、启动rsync守护进程
2、两台MySQL互为主从的配置
这里就不详细写出互为主从的配置过程了,如果不懂的朋友可以在Google上搜一下。有一点需要指出,my.cnf配置文件中请加上skip-name-resolve参数,使用IP来进行MySQL帐号验证。
3、主机、备机两台服务器负载监控、虚拟IP自动切换的failover.sh守护进程
(1)、启动failover.sh守护进程(为了开机能够自动运行,请将以下语句添加到/etc/rc.local文件中):
(2)、停止failover.sh守护进程:
会显示以下信息:
root 15428 1 0 Nov17 ? 00:00:03 /bin/sh /usr/local/webserver/failover/failover.sh
root 20123 6878 0 16:16 pts/2 00:00:00 grep failover.sh
然后杀死failover.sh的进程:
(3)、failover.sh代码内容(请注意其中的type设置,主机设为master,备机设为slave):
2、解释:
(1)、假设外网域名blog.s135.com解析到外网虚拟IP 72.249.146.214上,内网hosts设置db10对应内网虚拟IP 192.168.146.214
(2)、默认情况下,由主机绑定内、外网虚拟IP,备机作为备份,当主机的MySQL、Nginx或服务器出现故障无法访问时,备机会自动接管内、外网虚拟IP。两台服务器都启动负责监控、自动切换虚拟IP的守护进程/usr/bin/nohup /bin/sh /usr/local/webserver/failover/failover.sh 2>&1 > /dev/null &
(3)、主机和备机上的MySQL服务器互为主从,互相同步。在主机处于活动状态(即由主机绑定虚拟IP)时,读写主机的MySQL,写到主机的数据会同步到备机;在备机处于活动状态时,读写备机的MySQL,写到备机的数据会同步到主机(如果主机上的MySQL死掉暂时无法同步,主机上的MySQL恢复后,数据会自动从备机上同步过来,反之亦然)。
(4)、主机处于活动状态时,每20秒会把/data0/htdocs/(网页、程序、图片存放目录)、/usr/local/webserver/php/etc/(php.ini等配置文件目录)、/usr/local/webserver/nginx/conf/(Nginx配置文件目录)三个目录下的文件通过rsync推送到备机服务器上的对应目录(增量推送,两台服务器上一样的文件不会重复推送),反之如果备机处于活动状态时,每20秒会尝试把文件推送到主机。rsync的配置文件见两台服务器的/etc/rsyncd.conf,rsync守护进程的启动命令为rsync
--daemon
3、自动切换流程
(1)、主机默认绑定内、外网虚拟IP,当主机的MySQL、Nginx无法访问或服务器宕机,主机上的failover.sh守护进程会自动摘除自己绑定的内、外网虚拟IP(如果主机上的failover.sh死掉,无法摘除自己绑定的虚拟IP也没关系),备机上的failover.sh守护进程会自动接管备机原来绑定的内、外网虚拟IP,并发送ARPing包给内、外网网关更新MAC,强行接管。
(2)、备机绑定虚拟IP后,会发送ARPing包给内、外网网关,通知网关更新虚拟IP的MAC地址为备机的MAC地址,从而保证了切换后能够通过虚拟IP及时访问到备机。
(3)、如果主机的MySQL、Nginx启动起来,全部恢复正常访问,主机上的failover.sh守护进程会检测主机上的MySQL数据是否已经完全从备机上同步过来。如果同步延迟时间为0,主机会自动接管内、外网虚拟IP,并发送ARPing包给内、外网网关,而备机也会自动摘除内、外网虚拟IP。
(4)、整个切换流程均由failover.sh自动完成,无需人工处理。
4、注意事项(很重要):
(1)、crontab里的文件没有做自动同步,如果修改,需要手工在两台服务器上都做修改。
(2)、/data0/htdocs/目录内任何用ln -s建立的软连接,rsync不会自动同步,如果在一台服务器上建了软连接,需要手工在另外一台服务器上也建相同的软连接。
(3)、如果要删除/data0/htdocs/目录内的某些文件或目录,需要先删除处于活动状态(即绑定了虚拟IP)服务器上的文件或目录,再删除处于备用状态服务器上的文件或目录。
(4)、除了/data0/htdocs/(网页、程序、图片存放目录)、/usr/local/webserver/php/etc/(php.ini等配置文件目录)、/usr/local/webserver/nginx/conf/(Nginx配置文件目录)三个目录之外的其他配置修改,需要在两台服务器上都做修改。
二、配置文档与脚本:
1、主机、备机两台服务器的rsync配置(配置相同)
(1)、rsync配置文件
01 | vi /etc/rsyncd.conf |
02 |
03 | uid = root |
04 | gid = root |
05 | use chroot = no |
06 | max connections = 20 |
07 | pid file = /var/run/rsyncd.pid |
08 | lock file = /var/run/rsync.lock |
09 | log file = /var/log/rsyncd.log |
10 |
11 | [data0_htdocs] |
12 | path = /data0/htdocs/ |
13 | ignore errors |
14 | read only = no |
15 | hosts allow = 192.168.146.0/24 |
16 | hosts deny = 0.0.0.0/32 |
17 |
18 | [php_etc] |
19 | path = /usr/local/webserver/php/etc/ |
20 | ignore errors |
21 | read only = no |
22 | hosts allow = 192.168.146.0/24 |
23 | hosts deny = 0.0.0.0/32 |
24 |
25 | [nginx_conf] |
26 | path = /usr/local/webserver/nginx/conf/ |
27 | ignore errors |
28 | read only = no |
29 | hosts allow = 192.168.146.0/24 |
30 | hosts deny = 0.0.0.0/32 |
1 | /usr/bin/rsync --daemon |
这里就不详细写出互为主从的配置过程了,如果不懂的朋友可以在Google上搜一下。有一点需要指出,my.cnf配置文件中请加上skip-name-resolve参数,使用IP来进行MySQL帐号验证。
3、主机、备机两台服务器负载监控、虚拟IP自动切换的failover.sh守护进程
(1)、启动failover.sh守护进程(为了开机能够自动运行,请将以下语句添加到/etc/rc.local文件中):
1 | /usr/bin/nohup /bin/sh /usr/local/webserver/failover/failover.sh 2>&1 > /dev/null & |
1 | ps -ef | grep failover.sh |
root 15428 1 0 Nov17 ? 00:00:03 /bin/sh /usr/local/webserver/failover/failover.sh
root 20123 6878 0 16:16 pts/2 00:00:00 grep failover.sh
然后杀死failover.sh的进程:
1 | kill -9 15428 |
001 | #!/bin/sh |
002 | LANG=C |
003 | date=$(date -d "today" +"%Y-%m-%d %H:%M:%S") |
004 |
005 | #---------------配置信息(开始)--------------- |
006 | #类型:主机设为master,备机设为slave |
007 | type="master" |
008 |
009 | #主机、备机切换日志路径 |
010 | logfile="/var/log/failover.log" |
011 |
012 | #MySQL可执行文件地址,例如/usr/local/mysql/bin/mysql;MySQL用户名;密码;端口 |
013 | mysql_bin="/usr/local/webserver/mysql/bin/mysql" |
014 | mysql_username="root" |
015 | mysql_password="123456" |
016 | mysql_port="3306" |
017 |
018 | #内网网关 |
019 | gateway_eth0="192.168.146.1" |
020 |
021 | #主机内网真实IP |
022 | rip_eth0_master="192.168.146.213" |
023 |
024 | #备机内网真实IP |
025 | rip_eth0_slave="192.168.146.215" |
026 |
027 | #主机、备机内网共用的虚拟IP |
028 | vip_eth0_share="192.168.113.214" |
029 |
030 |
031 | #外网网关 |
032 | gateway_eth1="72.249.146.193" |
033 |
034 | #主机外网真实IP |
035 | rip_eth1_master="72.249.146.213" |
036 |
037 | #备机外网真实IP |
038 | rip_eth1_slave="72.249.146.215" |
039 |
040 | #主机、备机外网共用的虚拟IP |
041 | vip_eth1_share="72.249.146.214" |
042 | #---------------配置信息(结束)--------------- |
043 |
044 | #绑定内、外网虚拟IP |
045 | function_bind_vip() |
046 | { |
047 | /sbin/ifconfig eth0:vip ${vip_eth0_share} broadcast ${vip_eth0_share} netmask 255.255.255.255 up |
048 | /sbin/route add -host ${vip_eth0_share} dev eth0:vip |
049 | /sbin/ifconfig eth1:vip ${vip_eth1_share} broadcast ${vip_eth1_share} netmask 255.255.255.255 up |
050 | /sbin/route add -host ${vip_eth1_share} dev eth1:vip |
051 | /usr/local/webserver/php/sbin/php-fpm reload |
052 | kill -USR1 `cat /usr/local/webserver/nginx/logs/nginx.pid` |
053 | /sbin/service crond start |
054 | } |
055 |
056 | #解除内、外网虚拟IP |
057 | function_remove_vip() |
058 | { |
059 | /sbin/ifconfig eth0:vip ${vip_eth0_share} broadcast ${vip_eth0_share} netmask 255.255.255.255 down |
060 | /sbin/ifconfig eth1:vip ${vip_eth1_share} broadcast ${vip_eth1_share} netmask 255.255.255.255 down |
061 | /sbin/service crond stop |
062 | } |
063 |
064 | #主机向备机推送文件的函数 |
065 | function_rsync_master_to_slave() |
066 | { |
067 | /usr/bin/rsync -zrtuog /data0/htdocs/ ${rip_eth0_slave}::data0_htdocs/ > /dev/null 2>&1 |
068 | /usr/bin/rsync -zrtuog /usr/local/webserver/php/etc/ ${rip_eth0_slave}::php_etc/ > /dev/null 2>&1 |
069 | /usr/bin/rsync -zrtuog /usr/local/webserver/nginx/conf/ ${rip_eth0_slave}::nginx_conf/ > /dev/null 2>&1 |
070 | } |
071 |
072 | #备机向主机推送文件的函数 |
073 | function_rsync_slave_to_master() |
074 | { |
075 | /usr/bin/rsync -zrtuog /data0/htdocs/ ${rip_eth0_master}::data0_htdocs/ > /dev/null 2>&1 |
076 | /usr/bin/rsync -zrtuog /usr/local/webserver/php/etc/ ${rip_eth0_master}::php_etc/ > /dev/null 2>&1 |
077 | /usr/bin/rsync -zrtuog /usr/local/webserver/nginx/conf/ ${rip_eth0_master}::nginx_conf/ > /dev/null 2>&1 |
078 | } |
079 |
080 | #虚拟IP ARPing |
081 | function_vip_arping() |
082 | { |
083 | /sbin/arping -I eth0 -c 3 -s ${vip_eth0_share} ${gateway_eth0} > /dev/null 2>&1 |
084 | /sbin/arping -I eth1 -c 3 -s ${vip_eth1_share} ${gateway_eth1} > /dev/null 2>&1 |
085 | } |
086 |
087 | while true |
088 | do |
089 | #用HTTP协议检查虚拟IP |
090 | if (curl -m 30 -G http://${vip_eth1_share}/ > /dev/null 2>&1) && (${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${vip_eth0_share}" -e"show slave status\G" > /dev/null 2>&1) |
091 | then |
092 | #取得与内网VIP绑定的服务器内网IP |
093 | eth0_active_server=$(${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${vip_eth0_share}" -e"show slave status\G" | grep "Master_Host" | awk -F ': ' '{printf $2}') |
094 |
095 | #如果内网VIP=主机内网IP(主机MySQL中的Master_Host显示的是备机的域名或IP),且本机为主机 |
096 | if [ "${eth0_active_server}" = "${rip_eth0_slave}" ] && [ "${type}" = "master" ] |
097 | then |
098 | function_rsync_master_to_slave |
099 | function_vip_arping |
100 | #如果内网VIP=备机内网IP(备机MySQL中的Master_Host显示的是主机的域名或IP) |
101 | elif [ "${eth0_active_server}" = "${rip_eth0_master}" ] |
102 | then |
103 | if (curl -m 30 -G http://${rip_eth1_master}/ > /dev/null 2>&1) && (${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${rip_eth0_master}" -e"show slave status\G" | grep "Seconds_Behind_Master: 0" > /dev/null 2>&1) |
104 | then |
105 | #如果主机能够访问,数据库同步无延迟,且本机就是主机,那么由本机绑定虚拟IP |
106 | if [ "${type}" = "master" ] |
107 | then |
108 | #如果本机为主机 |
109 | function_bind_vip |
110 | function_vip_arping |
111 | echo "${date} 主机已绑定虚拟IP!(Type:1)" >> ${logfile} |
112 | else |
113 | #如果本机为备机 |
114 | function_remove_vip |
115 | echo "${date} 备机已去除虚拟IP!(Type:2)" >> ${logfile} |
116 | fi |
117 | else |
118 | if [ "${type}" = "slave" ] |
119 | then |
120 | #如果本机为备机 |
121 | function_rsync_slave_to_master |
122 | function_vip_arping |
123 | fi |
124 | fi |
125 | fi |
126 | else |
127 | #虚拟IP无法访问时,判断主机能否访问 |
128 | if (curl -m 30 -G http://${rip_eth1_master}/ > /dev/null 2>&1) && (${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${rip_eth0_master}" -e"show slave status\G" > /dev/null 2>&1) |
129 | then |
130 | #如果主机能够访问,且本机就是主机,那么由本机绑定虚拟IP |
131 | if [ "${type}" = "master" ] |
132 | then |
133 | function_bind_vip |
134 | function_vip_arping |
135 | echo "${date} 主机已绑定虚拟IP!(Type:3)" >> ${logfile} |
136 | else |
137 | function_remove_vip |
138 | echo "${date} 备机已去除虚拟IP!(Type:4)" >> ${logfile} |
139 | fi |
140 | elif (curl -m 30 -G http://${rip_eth1_slave}/ > /dev/null 2>&1) && (${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${rip_eth0_slave}" -e"show slave status\G" > /dev/null 2>&1) |
141 | then |
142 | #如果主机不能访问而备机能够访问,且本机就是备机,那么由备机绑定虚拟IP |
143 | if [ "${type}" = "slave" ] |
144 | then |
145 | function_bind_vip |
146 | function_vip_arping |
147 | echo "${date} 备机已绑定虚拟IP!(Type:5)" >> ${logfile} |
148 | else |
149 | function_remove_vip |
150 | echo "${date} 主机已去除虚拟IP!(Type:6)" >> ${logfile} |
151 | fi |
152 | else |
153 | echo "${date} 主机、备机全部无法访问!(Type:7)" >> ${logfile} |
154 | fi |
155 | fi |
156 | #每次循环暂停20秒(即间隔20秒检测一次) |
157 | sleep 20 |
158 | done |
相关文章推荐
- Nginx+PHP+MySQL双机互备、全自动切换方案
- SAP ECC 主数据自动切换、刷新方案
- nginx---Nginx/PHP/MySQL双机热备、自动切换方案
- Nginx+PHP+MySQL双机互备、全自动切换方案[转]
- Nginx+PHP+MySQL双机互备、全自动切换方案
- Nginx+PHP+MySQL双机互备、全自动切换方案
- 思科双线路接入方案(网通电信自动切换)
- Nginx+PHP+MySQL双机互备、全自动切换方案
- Nginx+PHP+MySQL双机互备、全自动切换方案
- cisco 双ISP线路接入 链路自动切换方案
- Windows上利用Python自动切换代理IP的终极方案!
- 针对web服务器容灾自动切换方案
- Nginx+PHP+MySQL双机互备、全自动切换方案[NO原创]
- MySQL主库高可用 -- 双主单活故障自动切换方案
- Nginx+PHP+MySQL双机互备、全自动切换方案
- Redis Sentinel主从复制自动切换方案