#

大数据

  • 大数据入门基础:SSH介绍

    什么是ssh简单说,SSH是一种网络协议,用于计算机之间的加密登录。如果一个用户从本地计算机,使用SSH协议登录另一台远程计算机,我们就可以认为,这种登录是安全的,即使被中途截获,密码也不会泄露。最早

    作者:大数据部落
    2020-06-06 22:49:09
  • 4台VM安装CDH5大数据平台

    记录一下,在VM里安装的CDH5.13.0

    作者:OpenStack2015
    2020-06-06 20:51:01
  • 数据分析必须想清楚的两个概念:指标和维度(转)

    指标与维度是数据分析中最常用到的术语,它们是非常基础的,但是又很重要,经常有朋友没有搞清楚它们之间的关系,只有掌握理解了,我们的数据分析工作开展就就容易多了。现在就来说说指标与维度的那些事。1、指标指

    作者:若恒
    2020-06-06 19:33:32
  • Hive和Impala加载和存储数据功能曝光

    Hive与Impala都是构建在Hadoop之上的数据查询工具,那么在实际的应用中,它们是如何加载和存储数据的呢?Hive和Impala存储和加载表,和所有的关系型数据库一样,有自己的数据管理结构,从

    作者:caosheng03
    2020-06-06 17:48:39
  • 云计算有什么特性

    云计算有什么特性?一般大家对云计算的了解可能停留在概念的层面上,而对于云计算的特性了解相对较少。今天就跟大家聊聊云计算的特性。   1、资源池化 云端计算资源需要被池化,以便通过多

    作者:Leah
    2020-06-06 17:45:56
  • Spark Streaming 技术点汇总

    Spark Streaming 支持实时数据流的可扩展(Scalable)、高吞吐(high-throughput)、容错(fault-tolerant)的流处理(stream processing)

    作者:首席数据师
    2020-06-06 17:19:50
  • ElasticSearch笔记整理(三):Java API使用与ES中文分词

    [TOC] pom.xml 使用maven工程构建ES Java API的测试项目,其用到的依赖如下: org.elast

    作者:xpleaf
    2020-06-06 07:45:04
  • Scala笔记整理(二):Scala数据结构—数组、map与tuple

    [TOC] 数组 定长数组 如果你需要一个长度不变的数组,可以用Scala中的Array。例如: val numsArray = new Array[Int] (30) //长度为30的整数数组,所

    作者:xpleaf
    2020-06-06 03:31:28
  • 从0开始学大数据-Java运算符(3)

    我们从零开始学习大数据技术,从java基础,到Linux技术涉猎,再深入到大数据技术的Hadoop、Spark、Storm技术,最后到大数据企业平台的搭建,层层递进,由点到面!希望技术大牛能过来指导学

    作者:升sheng
    2020-06-05 19:26:32
  • 大数据之---Yarn伪分布式部署和MapReduce案例

      1、软件环境 RHEL6 角色 jdk-8u45hadoop-2.8.1.tar.gz   sshxx.xx.xx.xx ip地址 NN hadoop01xx.xx.xx.xx ip地址 DN h

    作者:ycwyong
    2020-06-05 18:42:08