HDFS配置文件的关键参数主要包括以下几个方面:
core-site.xml
fs.defaultFS: 指定默认文件系统的URI,通常设置为HDFS的URL,例如 hdfs://namenode_host:9000。hdfs-site.xml
dfs.replication: 设置HDFS中文件的副本数。dfs.blocksize: 设置HDFS中文件块的大小。dfs.namenode.name.dir: 配置NameNode存储元数据的目录。dfs.datanode.data.dir: 配置DataNode存储数据块的目录。dfs.namenode.rpc-address: 配置NameNode的RPC地址和端口。dfs.namenode.http-address: 配置NameNode的HTTP地址和端口。dfs.namenode.shared.edits.dir: 标识Journal节点。dfs.journalnode.edits.dir: 存储Journal数据的地方。dfs.client.failover.proxy.provider: 用于Java客户端来连接Active的NameNode。hdfs-site.sh(在HA配置中)
dfs.nameservices: HDFS名字节点服务的逻辑名称。dfs.ha.namenodes.<nameservice_id>: 每一个NameNode在集群中的唯一标识。dfs.namenode.rpc-address.<nameservice_id>.<namenode_id>: NameNode在RPC时使用的端口。dfs.namenode.http-address.<nameservice_id>.<namenode_id>: NameNode对外提供的HTTP服务的端口。dfs.namenode.shared.edits.dir: 标识Journal节点。dfs.journalnode.edits.dir: 存储Journal数据的地方。这些参数涵盖了HDFS的基本配置、高可用性配置、数据存储和访问等方面的设置。根据具体的需求和集群规模,可能还需要调整其他相关参数。