#

partitionby

  • 7.spark core之数据分区

    简介   spark一个最重要的特性就是对数据集在各个节点的分区进行控制。控制数据分布可以减少网络开销,极大地提升整体性能。   只有Pair RDD才有分区,非Pair RDD分区的值是None。如

    作者:菲立思教育
    2020-07-25 13:43:08