您的位置:首页 > 其它

5.常见概念和问题

2017-05-17 13:54 274 查看
一、概念
1. 应用、实例、机器、CacheCloud客户端、CacheCloud服务端
2. 下线和心跳停止

二、常见开发问题
1. 客户端服务机房问题
2. 配置修改问题
3. maxmemory-policy配置说明
4. 数据清理问题
5. 应用选型问题
6. Jedis连接池GenericObjectPoolConfig配置
7. Redis-Sentinel类型的客户端调用过程(建议)
8. Redis-Cluster类型的客户端调用过程(建议)
9. 数据库个数问题
10. Redis-Sentinel类型应用统计中publish命令
11. 命令执行模块问题

三、运维技巧
1. 迁移机器实例
2. 更换Redis版本
3. 机器选取、分配技巧和坑
4. 个性化配置优化
5. 密码


一、概念:


1.
应用、实例、机器、CacheCloud客户端、CacheCloud服务端


(a)
实例

      一个redis进程,例如在ip为10.10.xx.xx启动了端口为6379的redis进程。 实例可以是redis单机数据节点、redis-sentinel类型下的redis数据节点和sentinel节点、也可以是redis-cluster下的redis数据节点。


(b)
应用

      一个redis集群是由若干个实例组成的,分配给每个cachecloud用户的redis集群就是一个应用(包含应用id)

      一个应用可以是一个Redis单机、一个Redis-Sentinel集群、一个Redis-Cluster集群。但是对于CacheCloud用户来说,不需要知道每个Redis实例的ip:port,只需要一个appId就可以获取这些细节。 主流云服务都采用appid的形式分配给用户,提供各种云服务。


(c)
机器

      一台物理机或者虚拟机。一台机器可以部署多个应用,多个实例。


(d)
cachecloud客户端

      提供给cachecloud用户通过appId快速接入cachecloud系统的api。(可以理解成获取应用对应redis实例的REST接口或者封装好的jar包)


(e)
cachecloud服务端(cachecloud管理系统)

      cachecloud用户通过appId获取Redis服务地址的服务端。 用于收集、展示、管理实例、应用、机器各个层面的数据,帮助cachecloud用户高效快速了解redis集群使用状态。


2.
下线和心跳停止

下线:管理员人工处理,真的下线了。
心跳停止:监控认为有可能下线,但是由于网络等原因,可能并没有下线,所以需要管理员处理


二、常见开发问题


1.
客户端服务机房问题

      Redis是比较依赖于网络环境的,较差的网络环境会带来一系列问题,最明显的就是访问速度,之前做过一个统计,跨机房要比同一个机房慢数倍。

      所以用户在申请应用的时候,要填写自己的服务所在的机房,这样Cachecloud的管理员会根据您的机房情况给予合理的分配。




2.
配置修改问题

      Cachecloud中各种类型(Redis-standalone, Redis-sentinel, Redis-cluster),在开启应用时,使用的我们认为最优的配置。

      但是,每个用户自己服务类型不同,需求可能会不同,例如对于maxmemory-policy、list-max-ziplist-entries、list-max-ziplist-value等配置就会有所不同,如果有需要修改配置,用户可以自行提交配置修改。

      修改方法如下:
(1) 进入应用页面的拓扑结构选项卡,点击ID进入实例页面



(2) 进入配置查询选项卡



(3) 点击申请修改配置,填写相应字段和值



(4) 后台管理员接收到申请邮件,进行处理,处理完成后,用户将收到相应处理邮件


注:
修改的配置会对应用的所有节点生效,因为所有节点的配置是统一的。


3.
maxmemory-policy配置说明

      Cachecloud对于每个Redis节点都设置了maxmemory, 所以需要有对应的maxmemory-policy,默认策略是volatile-lru。

      Redis提供了6种策略应对maxmemory, 用户可以根据自己的需求选择对应的策略。
volatile-lru -> 用lru算法删除过期的键值
allkeys-lru -> 用lru算法删除所有键值
volatile-random -> 随机删除过期的键值
allkeys-random -> 随机删除任何键值
volatile-ttl -> 删除最近要到期的键值(监控TTL)
noeviction -> 不会写操作,返回一个错误


4.
数据清理问题

      Cachecloud测试应用用户可以自行清理内存,处于安全的考虑正式应用需要联系管理员进行清理。 



5.
应用选型问题

      如上图所示,目前CacheCloud提供了3种类型的存储类型



      用户可以根据自己的需要选择适合自己的类型,下面对Redis的三种类型使用场景进行简单说明:
(1) 底层数据(例如mysql, hbase等等)允许被穿透,而且不考虑高可用性,可以考虑Redis-Standalone类型。
缺点: 非高可用、受单机影响扩展性(容量,读写等)有限
优点:结构简单



(2) 如想保证Redis的高可用(通过主从和sentinel机制),可以选择Redis-Sentinel类型
缺点:受单机影响扩展性(容量,读写等)有限
优点:高可用,结构相对简单



(3) 如想保证高可用、可扩展、大容量等要求,可以选择Redis-Cluster 下面给一些建议:
并不是说Redis-Cluster比其他两种类型好,用户需要根据自己的需求选择(比如内存需求量不大,保证高可用选择Redis-Sentinel类型就足够了)
如果当前或者未来需要的内存量超过6个G, 建议选择Redis-Cluster类型。




6.
Jedis连接池GenericObjectPoolConfig配置

      Jedis源码中使用了common-pool2作为连接池管理工具,无论是对于Redis-Standalone, Redis-Sentinel, Redis-Cluster进行操作,通常是通过jedis连接池(JedisPool, JedisSentinelPool)获取连接,所以需要选择合理的连接池配置。 通常的代码如下(可以参考cachecloud中代码接入模块):

GenericObjectPoolConfig poolConfig = new GenericObjectPoolConfig();
poolConfig.setMaxTotal(GenericObjectPoolConfig.DEFAULT_MAX_TOTAL * 5);
poolConfig.setMaxIdle(GenericObjectPoolConfig.DEFAULT_MAX_IDLE * 3);
poolConfig.setMinIdle(GenericObjectPoolConfig.DEFAULT_MIN_IDLE * 2);
poolConfig.setJmxEnabled(true);
poolConfig.setMaxWaitMillis(3000);
PipelineCluster redisCluster = ClientBuilder.redisCluster(appId)
.setJedisPoolConfig(poolConfig)
.setTimeout(1)
.setMaxRedirections(5)
.build();


其中poolConfig就是对于连接池的配置,其中有几个配置较为重要。
maxActive: 链接池中最大连接数,默认为8. (并非越大越好,具体原因可以参考GenericObjectPool的实现)
maxIdle: 链接池中最大空闲的连接数,默认为8.
minIdle: 连接池中最少空闲的连接数,默认为0.
maxWait: 当连接池资源耗尽时,调用者最大阻塞的时间,超时将跑出异常。单位,毫秒数;默认为-1.表示永不超时.
jmxEnabled: 当设置为true, 且服务开启的jmx服务时,使用jconsole, jvisualvm等工具将看到如下关于连接池的很全面的统计,这些统计结果有助于优化自己的配置。





其余配置如下:

minEvictableIdleTimeMillis: 连接空闲的最小时间,达到此值后空闲连接将可能会被移除。负值(-1)表示不移除。默认-1。这个也挺重要,一般不用移除,每次makeObject()开销比较大

numTestsPerEvictionRun: 对于“空闲链接”检测线程而言,每次检测的链接资源的个数。默认为3

testOnBorrow: 向调用者输出“链接”资源时,是否检测是有有效,如果无效则从连接池中移除,并尝试获取继续获取。默认为false。借资源时候是否要验证,比如jedis对象验证是ip:port是否发生改变,且执行一个ping命令

testOnReturn: 向连接池“归还”链接时,是否检测“链接”对象的有效性。默认为false。还资源时候是否要验证,同上。

testWhileIdle: 向调用者输出“链接”对象时,是否检测它的空闲超时;如果“链接”空闲超时,将会被移除。默认为false 空闲是否是否要定时检查一遍所有的对象

timeBetweenEvictionRunsMillis: “空闲链接”检测线程,检测的周期,毫秒数。如果为负值,表示不运行“检测线程”。默认为-1。

whenExhaustedAction: 当“连接池”中active数量达到阀值时,即“链接”资源耗尽时,连接池需要采取的手段, 默认为1:


7.
Redis-Sentinel类型的客户端调用过程(建议)

(1) 初始化JedisSentinelPool (通常是单例的,可以通过java代码或者spring实现),具体方法可以参考Cachecloud接入代码模块

//spring 配置
<bean id="redisSentinelFactory" class="com.sohu.tv.mobil.common.data.RedisSentinelFactory" init-method="init">
<property name="appId" value="appId"/>
</bean>
<bean id="redisSentinelPool" factory-bean="redisSentinelFactory" factory-method="getJedisSentinelPool"/>

package xx.xx;
import com.sohu.tv.builder.ClientBuilder;
import org.apache.commons.pool2.impl.GenericObjectPoolConfig;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import redis.clients.jedis.JedisSentinelPool;
public class RedisSentinelFactory {

private final Logger logger = LoggerFactory.getLogger(this.getClass());

private JedisSentinelPool jedisSentinelPool;

private int appId;

public void init(){
//根据自己需要设置poolConfig
GenericObjectPoolConfig poolConfig = new GenericObjectPoolConfig();
poolConfig.setMaxTotal(GenericObjectPoolConfig.DEFAULT_MAX_TOTAL * 10);
poolConfig.setMaxIdle(GenericObjectPoolConfig.DEFAULT_MAX_IDLE * 5);
poolConfig.setMinIdle(GenericObjectPoolConfig.DEFAULT_MAX_IDLE * 2);
poolConfig.setMaxWaitMillis(1000L);
poolConfig.setJmxEnabled(true);
try {
//根据自己需要设置超时时间
jedisSentinelPool = ClientBuilder.redisSentinel(appId)
.setTimeout(2000)
.setPoolConfig(poolConfig)
.build();
} catch (Exception e) {
logger.error(e.getMessage(), e);
}
}

public JedisSentinelPool getJedisSentinelPool() {
return jedisSentinelPool;
}

public void setAppId(int appId) {
this.appId = appId;
}
}


(2) 每次调用的建议写法:

Jedis jedis = null;
try {
jedis = redisSentinelPool.getResource();
//jedis command
} catch (Exception e) {
logger.error(e.getMessage(), e);
} finally {
if (jedis != null)
jedis.close();
}


其中jedis.close()并非关闭连接(可能是jedis定义上带来的歧义),如果看jedis源码会发现close实现如下:

public void close() {
if (dataSource != null) {
if (client.isBroken()) {
this.dataSource.returnBrokenResource(this);
} else {
this.dataSource.returnResource(this);
}
} else {
client.close();
}
}


(它会帮助你决定returnBrokenResource还是returnResource来归回jedis连接对象) 其中dataSource!=null说明使用pool管理jedis连接(具体可以参考JedisPool, JedisSentinelPool的实现中 setDataSource)


8.
Redis-Cluster类型的客户端调用过程(建议)

相比于Redis-Sentinel类型Jedis-Cluster的调用相对简单(Jedis源码内部对于cluster节点的选择以及pool的管理做了透明处理)
(1) 初始化JedisCluster(通常是单例的,可以通过java代码或者spring实现)。 具体方法可以参考cachecloud接入代码模块
(2) 每次调用直接使用jedisCluster.command即可。


9.
数据库个数问题

      Redis实例(Redis-Cluster除外)默认提供了16个数据库,用户可以使用select x来实现数据库的切换,但是这个功能从总体上弊大于利,不建议使用,默认使用数据库0即可。 具体原因: 如果你在其他语言的客户端中执行Redis命令,并且该客户端没有像redis-cli那样一直显示目标数据库的号码,那么在数次切换数据库之后,你很可能会忘记自己当前正在使用的是哪个数据库。当出现这种情况时,为了避免对数据库进行误操作,在执行Redis命令特别是像FLUSHDB这样的危险命令之前,最好先执行一个SELECT命令,显式地切换到指定的数据库,然后才执行别的命令,总之会陷入混乱。


10.
Redis-Sentinel类型应用统计中publish命令

      细心的人会发现即使你的Redis-Sentinel类型的应用没做过任何publish操作,命令统计依然会有周期性publish的调用记录。



原因是因为sentinel为了保证高可用性,订阅节点上 sentinel:hello 频道上publish的信息,确认redis节点的可用性。 所以这个统计用户不需要关心,可以忽略。


11.
命令执行模块问题

      为了保证数据安全,对于测试应用可以执行任意命令。



对于线上应用,只允许执行如下命令:
debug,exists,object,ttl,type,scan,get,getbit,getrange,mget,setrange,strlen,hexists,hget,hgetall,hkeys,hlen,hmget,hvals,hscan,lindex,llen,
lrange,scard,sismember,sscan,srandmember,zcard,zcount,zrange,zrangebyscore,zrank,zrevrange,zscore,zscan,dbsize,info,time,lastsave;



三、运维技巧:


1.
迁移机器实例

updating...



2.
更换Redis版本

updating...



3.
机器选取、分配技巧和坑

updating...



4.
个性化配置优化

updating...



5.
密码

考虑到安全和内网环境,CacheCloud并没有为每个Redis实例配置安全密码,如有需要请自行添加,并对个客户端进
行调整。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: