温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

大数据基础问答

发布时间:2020-03-02 06:49:01 来源:网络 阅读:297 作者:皮蛋拌黄瓜 栏目:大数据

什么是大数据?
用于①数据的存储:分布式文件系统(分布式存储)②数据的计算:分布式计算。简单一点就是存储和计算的问题,解决日常海量数据的分析。

学习大数据需要什么基础呢?
Java基础(Javase):类、类、继承、I/O、反射、泛型等;
Linux基础(Linux的操作):创建文件、目录、vi编辑器的使用;

Java和大数据都有哪些关系呢?
基于Java语言开发→→→ Hadoop体系结构、原理、编程
第一阶段:HDFS、MapReduce、HBase(NoSQL数据库
第二阶段:数据分析引擎 ---> Hive、Pig
数据采集引擎 ---> Sqoop、Flume
第三阶段:HUE:Web管理工具
ZooKeeper:实现Hadoop的HA
Oozie: 工作流引擎*
基于Java语言开发→→→Scala语言→→→Spark
Spark的学习
第一个阶段:Scala编程语言
第二个阶段:Spark Core-----> 基于内存,数据的计算
第三个阶段:Spark SQL -----> 类似Oracle中的SQL语句
第四个阶段:Spark Streaming ---> 进行实时计算(流式计算):比如:自来水厂

Apache Storm:类似Spark Streaming ---> 进行实时计算(流式计算):比如:自来水厂
NoSQLRedis基于内存的数据库

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI