#

hadoop

  • 大数据批处理框架Spring Batch 的全面解析

    如今微服务架构讨论的如火如荼。但在企业架构里除了大量的OLTP交易外,还存在海量的批处理交易。在诸如银行的金融机构中,每天有3-4万笔的批处理作业需要处理。针对OLTP,业界有大量的开源框架、优秀的架

    作者:Hjiangxue
    2020-07-18 20:24:50
  • 为什么使用Hive和Impala

    Impala 与Hive都是构建在Hadoop之上的数据查询工具,但是各有不同侧重,那么我们为什么要同时使用这两个工具呢?单独使用Hive或者Impala不可以吗?一、介绍Impala和Hive(1)

    作者:caosheng03
    2020-07-18 16:27:09
  • hadoop框架结构简单介绍

    近年,随着互联网的发展特别是移动互联网的发展,数据的增长呈现出一种爆炸式的成长势头。单是谷歌的爬虫程序每天下载的网页超过1亿个(2000年数据,)数据的爆炸式增长直接推动了海量数据处理技术的发展。谷歌

    作者:adnb34g
    2020-07-18 15:20:31
  • Cloudera Manager大数据平台搭建

    在企业里快速搭建大数据平台除了Ambria外还可以用Cloudera Manager,这两种工具相对于纯手工搭建确实便捷很多,但是有利也有弊,相对于新手来说就不便于掌握内部原理,不好排错等,而

    作者:hzlocean
    2020-07-18 12:29:18
  • 开发环境 hadoop&hbase集群环境磁盘丢失处理总结

    问题描述:集群192.168.22.178 master1192.168.22.179 master2  192.168.22.40 data1&zk&kafka&e

    作者:断臂人
    2020-07-18 11:35:07
  • 详解Python中API如何操作Hadoop hdfs

    小编这次要给大家分享的是详解Python中API如何操作Hadoop hdfs,文章内容丰富,感兴趣的小伙伴可以来了解一下,希望大家阅读完这篇文章之后能够有所收获。1:安装由于是windows环境(l

    作者:小猪
    2020-07-18 10:55:26
  • 如何使用Python构造hive insert语句

    这篇文章主要为大家展示了如何使用Python构造hive insert语句,内容简而易懂,希望大家可以学习一下,学习完之后肯定会有收获的,下面让小编带大家一起来看看吧。mysql可以使用nevicat

    作者:小猪
    2020-07-18 10:41:16
  • hadoop分布式集群部署以及过程中遇到的一些坑

    在hadoop学习过程中,首先第一步是部署伪分布以及分布式集群。在集群的部署过程中http://www.powerxing.com/install-hadoop-cluster/使用这篇博客作为参考。

    作者:zfno11
    2020-07-18 09:21:08
  • hadoop集群搭建(一)HDFS的namenode的HA搭建

    HDFS的namenode的HA搭建,准备好机器hadoop01    IP:192.168.216.203   GATEWAY:192.168.216.2  

    作者:梦的天际
    2020-07-18 09:06:40
  • HDFS伪分布式环境搭建

    HDFS概述及设计目标 什么是HDFS: 是Hadoop实现的一个分布式文件系统(Hadoop Distributed File System),简称HDFS 源自于Google的GFS论文 论文发

    作者:ZeroOne01
    2020-07-18 08:19:07