以下是在Linux中搭建HDFS集群的基本步骤:
/etc/profile或~/.bashrc文件,添加Hadoop相关环境变量并使其生效。core-site.xml,设置HDFS默认文件系统和NameNode地址;修改hdfs-site.xml,配置数据存储目录、副本数等;在slaves文件中列出DataNode主机名。hdfs namenode -format命令。start-dfs.sh启动NameNode,在所有DataNode节点上执行该命令启动DataNode。hdfs dfsadmin -report命令查看集群状态,或通过浏览器访问NameNode的Web界面进行查看。若要配置高可用性,还需设置NameNode主备节点、JournalNode及ZooKeeper等相关配置。