1、数据量倾斜:在某些情况下,实例上的数据分布不均衡,某个实例上的数据特别多。
2、数据访问倾斜:虽然每个集群实例上的数据量相差不大,但是某个实例上的数据是热点数据,被访问得非常频繁。 发生了数据倾斜,会造成那些数据量大的和访问高的实例节点,系统的负载升高,响应速度变慢。严重的情况造成内存资源耗尽,引起系统崩溃。
数据量倾斜
数据量倾斜,也就是实例上的数据分布不均衡,某个实例中的数据分布的特别多 。
数据量的倾斜,主要有下面三种情况:
1、bigkey导致倾斜;
2、Slot分配不均衡导致倾斜;
3、Hash Tag导致倾斜。