CentOS上的HDFS(Hadoop Distributed File System)配置文件主要包括core-site.xml、hdfs-site.xml和yarn-site.xml。以下是这些配置文件的关键点解读:
core-site.xml这个文件主要配置Hadoop的核心参数,包括文件系统的默认名称和临时目录等。
fs.defaultFS: 指定HDFS的默认文件系统URI。例如:
<property>
<name>fs.defaultFS</name>
<value>hdfs://namenode:8020</value>
</property>
hadoop.tmp.dir: 指定Hadoop使用的临时目录。例如:
<property>
<name>hadoop.tmp.dir</name>
<value>/path/to/hadoop/tmp</value>
</property>
hdfs-site.xml这个文件主要配置HDFS相关的参数,包括NameNode和DataNode的地址、副本数等。
dfs.replication: 指定HDFS文件的副本数。例如:
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
dfs.namenode.name.dir: 指定NameNode存储元数据的目录。例如:
<property>
<name>dfs.namenode.name.dir</name>
<value>/path/to/namenode/data</value>
</property>
dfs.datanode.data.dir: 指定DataNode存储数据的目录。例如:
<property>
<name>dfs.datanode.data.dir</name>
<value>/path/to/datanode/data</value>
</property>
dfs.namenode.http-address: 指定NameNode的HTTP地址和端口。例如:
<property>
<name>dfs.namenode.http-address</name>
<value>namenode:50070</value>
</property>
yarn-site.xml这个文件主要配置YARN相关的参数,包括ResourceManager和NodeManager的地址等。
yarn.resourcemanager.hostname: 指定ResourceManager的主机名。例如:
<property>
<name>yarn.resourcemanager.hostname</name>
<value>resourcemanager</value>
</property>
yarn.nodemanager.aux-services: 指定NodeManager提供的辅助服务。例如:
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
yarn.nodemanager.resource.memory-mb: 指定NodeManager可以使用的最大内存。例如:
<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>4096</value>
</property>
$HADOOP_HOME/etc/hadoop目录下。通过合理配置这些参数,可以优化HDFS的性能和稳定性,满足不同应用场景的需求。