#

hadoop

  • Hadoop 部署之 HBase (四)

    一、HBase是什么 HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目,是横向扩展的。 HBase是一个数据模型,类似于谷歌的大表设计,可以提供快速随机访问海量结

    作者:wzlinux
    2020-07-26 14:19:58
  • hadoop环境初始化搭建

    一、首先把hadoop二进制包和jdk的文件包download下来,并放置到合适目录的路径来解压(步骤省略) 二、在主机器上的hadoop解压出来的目录创建一个目录是专门放置hdfs的文件,把解压好的

    作者:wsw26
    2020-07-26 13:37:45
  • 安装Oozie4.1.0-CDH版本

    安装oozie经历了好长的时间,先是源码包,但是放弃了。。。然后就是安装的这个CDH版本的,弄了好久,经常报各种错误。最后整理出来这篇。这个安装过程同样适用于oozie4.1.0的其他的CDH版本。先

    作者:白话
    2020-07-26 12:53:28
  • 一文带你弄懂Livy——基于Apache Spark的REST服务

    背景 Apache Spark作为当前最为流行的开源大数据计算框架,广泛应用于数据处理和分析应用,它提供了两种方式来处理数据:一是交互式处理,比如用户使用spark-shell或是pyspark脚本启

    作者:Hjiangxue
    2020-07-26 11:58:04
  • 学习笔记--hadoop

    Hadoop hadoop-1.2.1.tar.gz jdk-6u32-linux-x64.binUseradd  -u 900 hadoopMv jdk1.6.0_32 &nbs

    作者:wx57d3f95165c0b
    2020-07-26 09:54:54
  • mac或linux下安装hadoop-2.8流程

    mac上安装hadoop 1,mac下的javall /usr/bin |grep'java'默认:/System/Library/Frameworks/JavaVM.framework/V

    作者:zhao_xiao_long
    2020-07-26 09:28:14
  • 老司机告诉你大数据开发:学Hadoop好还是Spark好?

    相信看这篇文章的你们,都和我一样对Hadoop和Apache Spark的选择有一定的疑惑,今天查了不少资料,我们就来谈谈这两种 平台的比较与选择吧,看看对于工作和发展,到底哪个更好。一、Hadoop

    作者:白金大数据
    2020-07-25 21:34:28
  • Hadoop常用的操作命令(2)

    Hadoop常用的操作命令 列出目录清单 [root@centos67 ~]# hdfs dfs -ls / 递归列出目录清单 [root@cen

    作者:小疯魔
    2020-07-25 14:25:41
  • namenode ha切换优化

    一、背景目前namenode使用了ha的部署模式,但系统会经常出现ha的自动切换(namenode节点其实正常)。经过调研发现可能的原因如下: HealthMonitor check本地namen

    作者:zouqingyun
    2020-07-25 09:57:58
  • Spark 的Core深入(二)

    Spark 的 Core 深入(二) 标签(空格分隔): Spark的部分 一: 日志清洗的优化 二:Spark RDD 三:SparkContext三大功能 四:Spark on YARN 五

    作者:flyfish225
    2020-07-25 09:40:23