当前位置：首页 > news >正文

【Hadoop 分布式部署十：配置HDFS 的HA、启动HA中的各个守护进程】

news 来源：原创 2024/4/29 10:51:20

官方参考配置地址：http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

一、

　　在Hadoop-senior.zuoyan.com 的主机上

　　　　首先将Hadoop安装目录下 etc下的hadoop的配置文件进行备份使用命令： cp -r hadoop dist-hadoop

　　　　然后在Hadoop安装目录下 data 文件夹内将tmp 文件夹重命名使用命令： mv tmp dits-tmp ,重命名完成后，在创建一个文件夹 mkdir tmp

　　然后在其余的两台主机上也重复这个操作

　　　　　将hadoop安装目录下的etc下的hadoop的所有配置文件复制文件为 dist-hadoop 然后再Hadoop的主安装目录中的data 下的 tmp 目录重命名为 dist-tmp 然后在创建新的数据存放目录

　　　　　　说明：图片中使用的命令有错误，不应该是重命名hadoop 而应该是重新复制文件，将复制文件的名字设置为 dist-hadoop

二、修改配置文件

　　　　打开core-site.xml 和　　hdfs-site.xml 文件

　　　　在core-site.xml 文件中配置

　　　　　　　因为是NameNode 的高可用行，配制两台机器的NameNode ，需要修改这个，所以需要配置成集群

　　　　在hdfs-site.xml 配置文件中配制：

　　　　　首先去除掉

	
	<!--配置secondary namenode 所在的主机-->
	<property>
            <name>dfs.namenode.secondary.http-address</name>
            <value>hadoop-senior03.zuoyan.com:50090</value>
        </property>

　　　　在 /opt/app/hadoop2.5.0/data 目录下创建文件夹 dfs/jn 用来存放NameNode的日志信息

　　　　然后在从hdfs-site.xml 文件中配置

        <!--配置Hadoop NameNode 的HA -->
    <property>
        <name>dfs.nameservices</name>
        <value>ns1</value>
    </property>

    
    <property>
      <name>dfs.ha.namenodes.ns1</name>
      <value>nn1,nn2</value>
    </property>
    
    <!--                 NameNode RPC  Adress             -->
    <property>
      <name>dfs.namenode.rpc-address.ns1.nn1</name>
      <value>hadoop-senior.zuoyan.com:8020</value>
    </property>
    
    <property>
      <name>dfs.namenode.rpc-address.ns1.nn2</name>
      <value>hadoop-senior02.zuoyan.com:8020</value>
    </property>
    
    <!-- 配置 WEB  界面的 访问地址和端口  -->
    <property>
        <name>dfs.namenode.http-address.ns1.nn1</name>
        <value>hadoop-senior.zuoyan.com:50070</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.ns1.nn2</name>
        <value>hadoop-senior02.zuoyan.com:50070</value>
    </property>
    
    <!--配置 NameNode Shared  EDITS  Address  和NameNode 日志文件存放的位置   -->
    <property>
      <name>dfs.namenode.shared.edits.dir</name>
      <value>qjournal://hadoop-senior.zuoyan.com:8485;hadoop-senior02.zuoyan.com:8485;hadoop-senior03.zuoyan.com:8485/ns1</value>
    </property>
    
    <property>
      <name>dfs.journalnode.edits.dir</name>
      <value>/opt/app/hadoop-2.5.0/data/dfs/jn</value>
    </property>

    <!-- 配置 HDFS  PROXY  Client -->
    <property>
      <name>dfs.client.failover.proxy.provider.mycluster</name>
      <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    
    <!--配置两个  NameNode的隔离机制  -->
    <!--   使用的方式是  ssh-fence   要求是两个NameNode 之间能够无密码登录  两个主机之间能互相ssh无密钥登录   -->
    <property>
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence</value>
    </property>

    <property>
      <name>dfs.ha.fencing.ssh.private-key-files</name>
      <value>/home/beifeng/.ssh/id_rsa</value>
    </property>

配置好主机一（hadoop-senior.zuoyan.com）需要将配置文件进行同步

　　　　使用命令 scp -r etc/hadoop/core-site.xml etc/hadoop/hdfs-site.xml etc/hadoop/slaves beifeng@hadoop-senior02.zuoyan.com:/opt/app/hadoop-2.5.0/etc/hadoop/