您的位置:首页 > 运维架构 > 网站架构

第6章gp_toolkit管理架构-Checking for Uneven Data Distribution

2017-12-13 22:24 393 查看
Checking for Uneven Data Distribution
Greenplum数据库中的所有表格都是分布式的,这意味着它们的数据被划分到系统中的所有段中。 如果数据分布不均匀,则查询处理性能可能会受到影响。 以下视图可以帮助诊断表格是否具有不均匀的数据分布:
•    gp_skew_coefficients

•    gp_skew_idle_fractions

gp_skew_coefficients

该视图通过计算每个段上存储的数据的变化系数(CV)来显示数据分布偏斜。 所有用户都可以访问此视图,但是非超级用户只能查看他们有权访问的表

Table 130: gp_skew_coefficients view

Column
描述
skcoid
表的对象ID。

skcnamespace
表中定义的名称空间。

skcrelname
表名。

skccoeff
变异系数(CV)以标准偏差除以平均值计算。 它考虑了数据序列平均值附近的平均值和可变性。 数值越低越好。 较高的值表示更大的数据倾斜。

 

 

gp_skew_idle_fractions

该视图通过计算在表扫描期间空闲的系统的百分比来显示数据分布倾斜,这是处理数据倾斜的指示符。 所有用户都可以访问此视图,但是非超级用户只能查看他们有权访问的表

Table 131: gp_skew_idle_fractions view

Column
描述
sifoid
表的对象ID。

sifnamespace
表中定义的名称空间。

sifrelname
表名。

siffraction
表扫描期间空闲的系统的百分比,这是数据分布不均或查询处理偏斜的指标。 例如,0.1的值表示10%的歪斜,0.5的值表示50%的歪斜,等等。 超过10%偏差的表应该评估其分配政策。

 

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐