#

hdfs

  • Hadoop核心组件:四步通晓HDFS

    Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件上的分布式文件系统,它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序,那么在实际应用中我们如何来操作使用呢?一、HD

    作者:caosheng03
    2020-07-04 15:21:05
  • hadoop源码解析---INodeReference机制

    本文主要介绍了hadoop源码中hdfs的INodeReference机制。在hdfs2.6版本中,引入了许多新的功能,一些原有的源代码设计也有一定的改造。一个重要的更新就是引入了快照功能。但是当HD

    作者:yushaoqing
    2020-07-04 13:52:07
  • Hadoop集群(一) Zookeeper搭建

    作为Hadoop初学者,自然要从安装入手。而hadoop的优势就是分布式,所以,也一定要安装分布式的系统。整体安装步骤,包括Zookeeper+HDFS+Hbase,为了文章简洁,我会分三篇blog记

    作者:hsbxxl
    2020-07-03 14:43:36
  • 部署HDFS

    HDFS存放副本时会优先在同一个数据节点备份一份,然后在不同的虚拟机架上备份namenode的HA是靠主备方式保证的,自动切换时要用到zookeeper,手动切换可以通过命令,备节点可以在数据节点上,

    作者:sw5720
    2020-07-03 08:40:27
  • 搭建部署Hadoop 之 HDFS

    HDFS  Hadoop 分布式文件系统分布式文件系统分布式文件系统可以有效解决数据的存储和管理难题– 将固定于某个地点的某个文件系统,扩展到任意多个地点/多个文件系统– 众多的节点组成一个

    作者:Xuenqlve
    2020-07-02 23:13:37
  • 贴一段java读取hdfs 解压gz zip tar.gz保存到hdfs的代码

    package main.java;import java.io.*;import java.util.LinkedList;import java.util.List;import java.uti

    作者:ranfengzheng
    2020-07-02 17:05:53
  • 开发人员学Linux(14):CentOS7安装配置大数据平台Hadoop2.9.0

    1.前言“大云物移”是当年很火热的一个话题,分别指大数据、云计算、物联网和移动互联网,其中大数据领域谈论得多就是Hadoop。当然Hadoop不代表大数据,而是大数据处理领域的一个比较有名的开源框架而

    作者:周金桥
    2020-07-02 12:32:25
  • 记一次HDFS的block corrupt事件

    还有最后两天班,明天晚上回家过年了,可是CDH突然报了一个block missing的错误,用 hdfs fsck /检查了一下,我们的块一共有500W个,missing了将近100W个,天呐,不过由

    作者:choulanlan
    2020-07-01 09:12:45
  • HDFS HA架构

    HA背景对于HDFS、YARN的每个角色都是一个进程,比如HDFS:NN/SNN/DN   老大是NNYARN:RM/NM   老大是RM对于上面,都会存在单点故障的问题,假如老大NN或者RM挂了,那

    作者:xiao酒窝
    2020-06-30 18:39:45
  • Hadoop HDFS Balancer

    Hadoop HDFS Balancer    Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点。当HDFS出现不平衡状况的时

    作者:zlfwmm
    2020-06-30 15:16:04