今天我们有1.25亿独立用户访问,只用了50毫秒——redis中setbit的使用
2016-12-03 19:15
417 查看
标题被我写的夸张了点。不过里面的内容确实是可以实现这样的东西。
通过《The Little Redis Book》看到有这样一篇博文《REDIS BITMAPS – FAST, EASY, REALTIME METRICS》,这次就不翻译了,已经有其他中文的版本。写这个目的在于一开始没看懂,想把整个详细的思想写出来。
先看setbit的使用。https://redis.io/commands/setbit。
先说位图,bitmap,根据二进制不同位置的值即可表示其代表的值。这就让我想起了上过的数字图像处理了。
setbit(key,offset,value)
offset是从左往右算的位数,从零开始,即高位往低位的值,例如100011,offset为0的时候值为1,4和5的值都为1。
本身redis存储字符串,以二进制格式存储。
所以文章里面的配图是错的。反过来了。
返回值是0和1,表示的是,设置前该offset位置下bit的值。
The offset argument is required to be greater than or equal to 0, and smaller than 2^32 (this limits bitmaps to 512MB)
bitmap本身offset的限制就是0到2^32,内存限制为521MB,分配所需时间才几百ms,刚刚好是2^32个bit,也就是4294967296,也就是说,offset最大能去到4294967296-1去。有四十二亿。
照着文章作者的思路。他们网站封顶有1亿多的用户。每个用户都有自己的用户ID。一个用户做操作,我们有个40多亿长度全为0的位图。
我们只需要在这个根据ID做位置定位将其改为1,就算记录了该用户的操作了。
而要统计一天用多少用户做操作(为什么说操作不说登录了,因为不仅仅限于登录,浏览某某东西,写日记等等都可以用这种方法)
,除去重复,总数就是这个位图里面值为1的个数。
将文章的代码具体实现了一下。
Jedis j = new Jedis("localhost");
//auth password
j.auth("myredis");
//2016-12-3 login operation user
j.setbit("login:2016-12-3".getBytes(), 1, true);
j.setbit("login:2016-12-3".getBytes(), 124431, true);
j.setbit("login:2016-12-3".getBytes(),1231, true);
j.setbit("login:2016-12-3".getBytes(), 323121, true);
BitSet b = BitSet.valueOf(j.get("login:2016-12-3".getBytes()));
//the number of bit value 1
int lognum3 = b.cardinality();
System.out.println("2016-12-3 login user number: "+lognum3);
//2016-12-3 login operation user
j.setbit("login:2016-12-4".getBytes(), 1, true);
j.setbit("login:2016-12-4".getBytes(), 1231231, true);
j.setbit("login:2016-12-4".getBytes(), 334441, true);
BitSet b2 = BitSet.valueOf(j.get("login:2016-12-4".getBytes()));
int lognum4 = b2.cardinality();
System.out.println("2016-12-4 login user number: "+b2.cardinality());
b.or(b2);
//or操作之后 同样userid的记录会重合不做记录,所以具体的数据统计看自己的需求而定
int lognumexceptsameuser = b.cardinality();
int logtotalnum = lognum3+lognum4;
System.out.println("2016-12-3 to 2016-12-4 login user number except same userid: "+lognumexceptsameuser);
System.out.println("2016-12-3 to 2016-12-4 login user number: "+logtotalnum);
输出:
2016-12-3 login user number: 4
2016-12-4 login user number: 3
2016-12-3 to 2016-12-4 login user number except same userid: 6
2016-12-3 to 2016-12-4 login user number: 7
如果用户数登录求和时,不同日期的用户ID登录需要计算,那么就不要做或操作,将每天的登录数求和即可。如果求的是一个月内,用户登录总数,用户登录多次只算一次的话,只需要将这段时间内的bit进行或操作即可。
确实快,不需要你记录到数据库。只需要一个bit就能记录该用户登录。
利用了redis本身用内存存储的优势。这种需求下的解决方案确实是快,方便。
当然这种只针对这种特殊的需求,你非要每天用户重复登录的次数也算进去,当然就不能用这种方法。所以,针对不同的需求,找出最优方案才是最好的。
通过《The Little Redis Book》看到有这样一篇博文《REDIS BITMAPS – FAST, EASY, REALTIME METRICS》,这次就不翻译了,已经有其他中文的版本。写这个目的在于一开始没看懂,想把整个详细的思想写出来。
先看setbit的使用。https://redis.io/commands/setbit。
先说位图,bitmap,根据二进制不同位置的值即可表示其代表的值。这就让我想起了上过的数字图像处理了。
setbit(key,offset,value)
offset是从左往右算的位数,从零开始,即高位往低位的值,例如100011,offset为0的时候值为1,4和5的值都为1。
本身redis存储字符串,以二进制格式存储。
所以文章里面的配图是错的。反过来了。
返回值是0和1,表示的是,设置前该offset位置下bit的值。
The offset argument is required to be greater than or equal to 0, and smaller than 2^32 (this limits bitmaps to 512MB)
bitmap本身offset的限制就是0到2^32,内存限制为521MB,分配所需时间才几百ms,刚刚好是2^32个bit,也就是4294967296,也就是说,offset最大能去到4294967296-1去。有四十二亿。
照着文章作者的思路。他们网站封顶有1亿多的用户。每个用户都有自己的用户ID。一个用户做操作,我们有个40多亿长度全为0的位图。
我们只需要在这个根据ID做位置定位将其改为1,就算记录了该用户的操作了。
而要统计一天用多少用户做操作(为什么说操作不说登录了,因为不仅仅限于登录,浏览某某东西,写日记等等都可以用这种方法)
,除去重复,总数就是这个位图里面值为1的个数。
将文章的代码具体实现了一下。
Jedis j = new Jedis("localhost");
//auth password
j.auth("myredis");
//2016-12-3 login operation user
j.setbit("login:2016-12-3".getBytes(), 1, true);
j.setbit("login:2016-12-3".getBytes(), 124431, true);
j.setbit("login:2016-12-3".getBytes(),1231, true);
j.setbit("login:2016-12-3".getBytes(), 323121, true);
BitSet b = BitSet.valueOf(j.get("login:2016-12-3".getBytes()));
//the number of bit value 1
int lognum3 = b.cardinality();
System.out.println("2016-12-3 login user number: "+lognum3);
//2016-12-3 login operation user
j.setbit("login:2016-12-4".getBytes(), 1, true);
j.setbit("login:2016-12-4".getBytes(), 1231231, true);
j.setbit("login:2016-12-4".getBytes(), 334441, true);
BitSet b2 = BitSet.valueOf(j.get("login:2016-12-4".getBytes()));
int lognum4 = b2.cardinality();
System.out.println("2016-12-4 login user number: "+b2.cardinality());
b.or(b2);
//or操作之后 同样userid的记录会重合不做记录,所以具体的数据统计看自己的需求而定
int lognumexceptsameuser = b.cardinality();
int logtotalnum = lognum3+lognum4;
System.out.println("2016-12-3 to 2016-12-4 login user number except same userid: "+lognumexceptsameuser);
System.out.println("2016-12-3 to 2016-12-4 login user number: "+logtotalnum);
输出:
2016-12-3 login user number: 4
2016-12-4 login user number: 3
2016-12-3 to 2016-12-4 login user number except same userid: 6
2016-12-3 to 2016-12-4 login user number: 7
如果用户数登录求和时,不同日期的用户ID登录需要计算,那么就不要做或操作,将每天的登录数求和即可。如果求的是一个月内,用户登录总数,用户登录多次只算一次的话,只需要将这段时间内的bit进行或操作即可。
确实快,不需要你记录到数据库。只需要一个bit就能记录该用户登录。
利用了redis本身用内存存储的优势。这种需求下的解决方案确实是快,方便。
当然这种只针对这种特殊的需求,你非要每天用户重复登录的次数也算进去,当然就不能用这种方法。所以,针对不同的需求,找出最优方案才是最好的。
相关文章推荐
- 尊敬的用户:您访问的域名有误或网页不存在,您可以使用我们提供的以下服务
- 尊敬的用户:您访问的域名有误或网页不存在,您可以使用我们提供的一下服务
- 使用redis进行用户接口访问时间次数限制
- 使用“成员资格管理用户”以及“Forms 身份验证提供程序”保护需要授权才能访问的资源
- 今天使用ie6访问有iframe页面时,出现cookie被阻挡的问题解决方法
- ssh 使用新法公网(合法 ip)用户访问内网(私有 ip)服务器(http,ftp,sshd,cvs...),内网的朋友不妨一看[zt]
- 6月Facebook独立访问用户增34% 高于MySpace
- 如何恢复一个非用户sa创建的数据库,且使用原用户创建者进行访问
- 使用sc分配权限-限制某个用户或用户组对某个service的访问
- 使用Filter技术防止用户非法访问页面
- comScore:2010年7月Facebook独立访问用户达5.72亿
- 今天操作公司的数据库,出现单个用户使用的情况,解决方案如下
- 原来Gmail中使用了ActiveX,那么如何保证linux用户的访问行呢?
- RHEL6---VSFTPD服务器配置之一:使用mysql实现虚拟用户的访问
- 使用geo_ip获得当前访问用户所在的城市
- 如何让用户在用webview访问网页时嵌入我们自己的内容
- 让XP HOME使用组策略、本地用户和组、安全策略以及文件访问权限的修改
- 一台可以让32个用户同时、独立使用办公软件的电脑
- 使用VSFTPD配置虚拟用户访问权限
- 美点评网站Yelp2011年月度独立访问用户数达5000万