合 GreenPlum性能调优之数据倾斜
数据分布
greenplum中数据分布情况直接影响到查询的效率,原因是greenplum架构是由性能最差的segment实例决定,所以数据分布不均匀会影响整个集群的性能。
检查数据的偏斜/倾斜情况:
查询比较慢:
1 2 3 4 5 | -- 查看skccoeff偏差系数 SELECT * FROM gp_toolkit.gp_skew_coefficients WHERE skcrelname = 'table_name'; -- 查看空闲偏差系数:越小越好 SELECT * FROM gp_toolkit.gp_skew_idle_fractions WHERE sifrelname = 'table_name'; |