nginx学习 - ip_hash的hash算法
2012-08-13 15:27
387 查看
直接看代码:
主要代码在红色三行。
1、for循环 i取 012三个值,而ip的点分十进制表示方法将ip分成四段(如:192.168.1.1),但是这里循环时只是将ip的前三个端作为参数加入hash函数。这样做的目的是保证ip地址前三位相同的用户经过hash计算将分配到相同的后端server。
作者的这个考虑是极为可取的,因此ip地址前三位相同通常意味着来着同一个局域网或者相邻区域,使用相同的后端服务让nginx在一定程度上更具有一致性。
2、哈希函数:hash = (hash * 113 + iphp->addr[i]) % 6271
作者使用了这样一个极为简单的hash函数,当然目的是为了性能。而这样一个hash函数的效果如何呢?我们来测试一下。
通过上面比较粗糙的代码,可以验证,该hash函数的效果并不是很好,产生的的分布并不是太均衡。但这在nginx选择后端server这样的应用场景已经足够,关键是其简单性。
162 for ( ;; ) { 163 164 for (i = 0; i < 3; i++) { 165 hash = (hash * 113 + iphp->addr[i]) % 6271; //iphp->addr[i]为ip的点分十进制法的第i段 166 } 167 168 p = hash % iphp->rrp.peers->number; 169 170 n = p / (8 * sizeof(uintptr_t)); 171 m = (uintptr_t) 1 << p % (8 * sizeof(uintptr_t)); 172 173 if (!(iphp->rrp.tried & m)) { 174 175 ngx_log_debug2(NGX_LOG_DEBUG_HTTP, pc->log, 0, 176 "get ip hash peer, hash: %ui %04XA", p, m); 177 178 peer = &iphp->rrp.peers->peer[p]; 179 180 /* ngx_lock_mutex(iphp->rrp.peers->mutex); */ 181 182 if (!peer->down) { 183 184 if (peer->max_fails == 0 || peer->fails < peer->max_fails) { 185 break; 186 } 187 188 if (now - peer->accessed > peer->fail_timeout) { 189 peer->fails = 0; 190 break; 191 } 192 } 193 194 iphp->rrp.tried |= m; 195 196 /* ngx_unlock_mutex(iphp->rrp.peers->mutex); */ 197 198 pc->tries--; 199 } 200 201 if (++iphp->tries >= 20) { 202 return iphp->get_rr_peer(pc, &iphp->rrp); 203 } 204 }
主要代码在红色三行。
1、for循环 i取 012三个值,而ip的点分十进制表示方法将ip分成四段(如:192.168.1.1),但是这里循环时只是将ip的前三个端作为参数加入hash函数。这样做的目的是保证ip地址前三位相同的用户经过hash计算将分配到相同的后端server。
作者的这个考虑是极为可取的,因此ip地址前三位相同通常意味着来着同一个局域网或者相邻区域,使用相同的后端服务让nginx在一定程度上更具有一致性。
2、哈希函数:hash = (hash * 113 + iphp->addr[i]) % 6271
作者使用了这样一个极为简单的hash函数,当然目的是为了性能。而这样一个hash函数的效果如何呢?我们来测试一下。
#include <iostream> #include <cstdlib> #include <ctime> using namespace std; const double per = 0.5; //阈值,后端server命中个数与平均值偏离超过该比例则输出相关信息 int main() { srand((unsigned)time(NULL)); int peer_number; //后端server节点数 peer_number= rand() % 6271 + 1; //随机产生 int* result = new int[peer_number]; //存放每个后端server命中次数 for(int i = 0; i < peer_number; i++) { //初始化 result[i] = 0; } int total_num = 1000000; //进行hash的总次数 int total_num_temp = total_num; while(total_num_temp-->0) { int rand_num[3]; for(int i = 0; i < 3; i++) { rand_num[i]= rand()%255; //随机生成三个数作为ip地址前三段 // cout << i << ": " << rand_num[i] <<endl; } int hash = 89; for(int i = 0; i < 3; i++) { hash = (hash * 113 + rand_num[i]) % 6271; //hash运算 } hash = hash % peer_number; result[hash]++; //统计hash值命中 } // 设定一个阈值per,当每个server命中次数与平均值偏差超过该比例时记录。 int avg = total_num/peer_number; int max =(int) ((double)avg * (1 + per)); int min =(int) ((double)avg * (1 - per)); for(int i = 0; i < peer_number; i++) { //cout<<i<<": "<<result[i]<< endl; if (result[i] > max || result[i] < min){ for(int j = 0; j < peer_number; j++) { cout<<j<<": "<<result[j]<< endl; } cout << "avg: " << avg << ", max: " << max << ", min: " << min << ", i: " << i << ", result[i]: " << result[i] <<endl; cout << peer_number << endl; return 1; } } delete []result; }
通过上面比较粗糙的代码,可以验证,该hash函数的效果并不是很好,产生的的分布并不是太均衡。但这在nginx选择后端server这样的应用场景已经足够,关键是其简单性。
相关文章推荐
- Nginx之ip_hash的hash算法
- 【nginx源码学习与运用 八】哈希表结构ngx_hash_t
- nginx 源码学习笔记(十)——基本容器——ngx_hash
- Nginx的负载均衡 - 保持会话 (ip_hash)
- Nginx IP Hash一点记录
- 微信内嵌浏览器sessionid丢失问题,nginx ip_hash将所有请求转发到一台机器
- Nginx的负载均衡 - 保持会话 (ip_hash)
- nginx使用用户真实IP做hash(解决经过CND后ip_hash失效问题)
- nginx和tomcat实现rr,ip_hash,sticky调度,实现session共享,nginx网页加密,网页重定向,盗链和防盗链技术的实现
- nginx+keepalived负载均衡可用框架(二 nginx负载均衡-ip_hash)
- nginx roundrobin 、keepalive、ip_hash模块分析
- nginx 源码学习笔记(十)——基本容器——ngx_hash
- nginx学习6——显示并发连接数,域名重定向,基于端口的配置,基于ip的配置
- Nginx中ip_hash负载均衡中location的proxy_pass配置与说明
- nginx使用用户真实IP做hash(解决经过CND后ip_hash失效问题)
- nginx加权轮询和ip_hash
- NGINX学习笔记——Choosing an Outgoing IP Address
- NginxUpStream模块三种绑定模默认wrr ip_hash 以及hashkey的实现
- nginx负载均衡时RR和ip_hash策略解析
- Nginx中ip_hash负载均衡中location的proxy_pass配置与说明