#

长尾

  • hive中数据倾斜

    数据倾斜通常指hive根据key值hash分发到各个节点,相同的key值会分发到一个执行节点中,由于某些key值对应的数据量比其它key值的数据量大很多,导致某些执行节点的运行时间远大于其它节点,从而

    作者:abebill
    2020-06-14 19:17:24