#

hadoop

  • Tornado学习笔记(四)

    一、Tornado的语言国际化方法Tornado做国际化折腾了一下下,Tornado这部分的官方文档太poor了。所以自己记录一下如何用tornado结合gettext做国际化。第一步,在项目路径下建

    作者:Slaytanic
    2020-08-06 09:20:19
  • 数据分析:Hive、Pig和Impala

    本文主要分享Hadoop三大分析工具:Hive、Pig和Impala。Hive和Pig是高级数据语言,基于Mapreduce,底层处理的时候会转换成Mapreduce去提交,Hive和Pig都是开源的

    作者:caosheng03
    2020-08-06 06:54:45
  • Hadoop 2.4安装与配置

    一、hadoop2.4编译方法可参考:Linux64位操作系统(CentOS6.6)上如何编译hadoop2.4.0。二、准备工具1.部署准备两个机器test1为Master,test2为Slave。

    作者:liyong0802
    2020-08-06 03:14:24
  • Hadoop 系列(五)—— Hadoop 集群环境搭建

    一、集群规划 这里搭建一个 3 节点的 Hadoop 集群,其中三台主机均部署 DataNode 和 NodeManager 服务,但只有 hadoop001 上部署 NameNode 和 Resou

    作者:heibaiying
    2020-08-06 02:41:06
  • Hadoop学习--通过配置文件修改文件副本数块大小--day04

    import java.io.ByteArrayOutputStream;import java.io.FileInputStream;import java.io.FileOutputStream;

    作者:zhicx
    2020-08-06 00:08:01
  • 6、MapReduce自定义分区实现

    MapReduce自带的分区器是HashPartitioner原理:先对map输出的key求hash值,再模上reduce task个数,根据结果,决定此输出kv对,被匹配的reduce任务取走。自定

    作者:victor19901114
    2020-08-05 23:30:39
  • hive 基本架构

    如下图所示,从逻辑上来看,Hive包含了3大部分。 Hive Clients Hive Services Hive Storage and Computing 用户操作Hive的接口主要有三个:C

    作者:choulanlan
    2020-08-05 22:06:12
  • Distcp 分布式拷贝

    (1)discp原理    DistCp(Distributed Copy)是用于大规模集群内部或者集群之间的高性能拷贝工具,和在linux上执行cp,scp实

    作者:酱酱酱子啊
    2020-08-05 16:29:32
  • Yarn流程、Yarn与MapReduce 1相比

    [TOC] Yarn流程 可以参考《Hadoop权威指南》P79中的图示与介绍进行理解,当然结合下面这个图示与其中的解释进行理解则会更加清晰易懂,当然,基本的参考个人觉得书本上的图示要更精简,下面这

    作者:xpleaf
    2020-08-05 16:19:48
  • yarn知识体系总结

    2019/2/18 星期一 yarn知识体系总结 Yarn 产生的原因(1)MapreduceV1 中,jobtracker 存在瓶颈:集群上运行的所有mr 程序都有jobtracker 来调度SPO

    作者:马吉辉
    2020-08-05 16:02:06