温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Hive外部表分区是怎样的

发布时间:2021-10-19 18:30:43 来源:亿速云 阅读:119 作者:柒染 栏目:大数据

Hive外部表分区是怎样的,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

1:定义
    未被external修改的是内部表(MANAGED TABLE),被external修饰的为外部表(EXTERNAL TABLE)
    创建外部表语法:

    create external table person2(
     id int,
     name string,
     hobby array<string>,
     addr map<string,string>
     )
     row format delimited 
     fields terminated by ',' 
     collection items terminated by '-' 
     map keys terminated by ':' 
     location '/user/person2' 
     ;

2:区别
    1)内部表数据由hive自身管理,外部表数据由hdfs来管理
        内部表数据存储的位置默认/user/hive/warehouse,
        外部表数据存储的位置由用户自己指定

    2)删除内部表会直接删除元数据和存储数据
       删除外部表仅仅只会删除元数据,HDFS上的文件不会删除。


3:分区表
    1)定义语法

     create table p1(
             id int,
             name string,
             hobby array<string>,
             addr map<string,string>
         )
         partitioned by (p_dt string) 
         row format delimited 
         fields terminated by ',' 
         collection items terminated by '-' 
         map keys terminated by ':' 
         ;


    注意:分区字段不能和表中的字段重复,若要创建分区表,必须在表定义的时候创建partition

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注亿速云行业资讯频道,感谢您对亿速云的支持。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI