温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Hive的特点是什么

发布时间:2021-12-09 15:28:34 来源:亿速云 阅读:206 作者:iii 栏目:云计算

本篇内容介绍了“Hive的特点是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

Hive是构建在hadoop上的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,也急速hi数据提取转化加载(ETL),并提供简单的SQL查询功能,称为HQL(这边要和Hibernate区别一下),允许熟悉SQL的用户查询数据。它是工作在thrift上的,控制分隔符也允许用户指定数据格式。

Hive的特点

支持索引,加快数据查询。

有不同的存储类型,如HBase中的文件、纯文本文件

将元数据保存在关系数据库中,大大减少了在查询过程中执行语义检查的时间

可以直接使用存储在Hadoop文件系统中的数据

内置大量用户函数UDF来操作时间、字符串和其他的数据挖掘工具,支持用户扩展UDF函数来 完成内置函数无法实现的操作

类SQL的查询方式,将SQL查询转换为MapReduce的Job在Hadoop集群上执行。

Hive的缺点

在静态处理的Hadoop上执行延迟高,作业提交和调度开销大,有分钟集的延迟,因此不适合需要低延迟的应用,比如练级事务处理(OLTP)

其中HIVE和hadoop之间的关系

Hive的特点是什么Hive的特点是什么

Hive的架构如上图所示,包含用户访问接口(CLI、JDBC/ODBC、WEB GUI和Thrift Server)元数据存储(Metastore),驱动组件(编译,优化,执行)。

用户访问接口:用户交互Hive数据仓库的工具接口。

CLI(command line interface)命令行接口。

Thrift Server可以用不同语言调用Hive接口

HWI(Hive web interface)提供通过网页访问Hive提供的服务

Metastore与Hive驱动互联方式:1.集成模式  2.远程模式

主要用来存储Hive中的元数据,一般使用Mysql或者Derby数据库。

驱动组件包括编译器、优化器和执行引擎,分别完成词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中并在虽有由MapperReduce调用执行。

“Hive的特点是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI