当前位置: 首页 > news >正文

Hadoop集群配置运行

文章目录

  • 前期准备
  • 配置JDK环境
  • Hadoop安装配置
    • hadoop-env.sh
    • core-site.xml
    • hdfs-site.xml
    • mapred-site.xml
    • yarn-site.xml
    • workers
  • Hadoop集群启动
    • hdfs格式化
    • 启动集群
  • 参考

前期准备

下面以三台Ubuntu虚拟机搭建集群。
需要互相ssh能够免密通讯
如果不行,可以参考:Unbuntu使用手机热点创建两台电脑的集群(实现ssh免密通信)
下面需要的软件安装包都放在百度网盘,有需要的自取。
链接:https://pan.baidu.com/s/1rcG1xckk3zmp9BLmf74hsg?pwd=1111
提取码:1111

配置JDK环境

下载jdk8,解压缩:

tar -xxvf jdk1.8.tar.xz

验证文件可用性,java执行: java -version查看结果:进入java所在目录,执行 ./java -version
在这里插入图片描述
说明验证成功。

然后需要添加到环境变量里:

首先进入用户名的目录
在这里插入图片描述
然后编辑 .bashrc 文件

vim .bashrc

按i进行编辑

在这里插入图片描述
然后
按ESC
:wq
保存退出
然后运行

. .bashrc

然后命令行输入

java -version

在这里插入图片描述
说明配置成功。

Hadoop安装配置

同样先解压文件

tar -zxvf hadoop-3.3.2.tar.gz

然后编辑.bashrc配置环境变量
在这里插入图片描述
然后同样需要

. .bashrc

然后输入

hadoop

在这里插入图片描述
说明配置成功。

然后还有许多文件需要配置:
在这里插入图片描述
进入此目录,开始配置文件

hadoop-env.sh

vim hadoop-env.sh

需要在最后加上

export JAVA_HOME=/home/bigdata3/software/jdk1.8
export HADOOP_PID_DIR=/home/bigdata3/software/hadoopData/pids

第一个配置jdk路径
第二个配置日志文件路径

core-site.xml

<configuration>
<!-- 设置dfs副本数,不设置默认是3个   -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
              <name>dfs.namenode.http-address</name>
              <value>master:50070</value>
    </property>
<!-- 设置secondnamenode的端口   -->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>master:50090</value>
    </property>

</configuration>

hdfs-site.xml

<configuration>
<!-- 设置dfs副本数,不设置默认是3个   -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
              <name>dfs.namenode.http-address</name>
              <value>master:50070</value>
    </property>
<!-- 设置secondnamenode的端口   -->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>master:50090</value>
    </property>

</configuration>

不过dfs.namenode.secondary设置为master:50090是非常不合理的。
但是为了方便就这样了。

mapred-site.xml


<configuration>
      <property>
             <name>mapreduce.framework.name</name>
             <value>yarn</value>
     </property>
     <property>
             <name>mapreduce.jobhistory.address</name>
             <value>master:10020</value>
      </property>

<property>
             <name>HADOOP_HOME</name>
             <value>/home/bigdata3/software/hadoop-3.2.2</value>
      </property>
<property>
  <name>yarn.app.mapreduce.am.env</name>
  <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property>
<property>
  <name>mapreduce.map.env</name>
  <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property>
<property>
  <name>mapreduce.reduce.env</name>
  <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property>

</configuration>

最重要的就是第一个配置

yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
                <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
        <property>
                <name>yarn.resourcemanager.address</name>
                <value>master:8032</value>
        </property>
        <property>
                <name>yarn.resourcemanager.scheduler.address</name>
                <value>master:8030</value>
        </property>
        <property>
                <name>yarn.resourcemanager.resource-tracker.address</name>
                <value>master:8035</value>
        </property>
        <property>
                <name>yarn.resourcemanager.admin.address</name>
                <value>master:8033</value>
        </property>
        <property>
                <name>yarn.resourcemanager.webapp.address</name>
                <value>master:8088</value>
        </property>

</configuration>

workers

指定datanode节点,将所有datanode节点域名写入文件,一般是一行一个,所有集群中的节点此文件内容相同。

slave0
slave1
master

Hadoop集群启动

hdfs格式化

要在namenode上执行命令:

hadoop namenode -format

在这里插入图片描述
这样说明初始化成功

启动集群

start-all.sh

启动成功可以进行jps验证和web页面验证。

不过队友还没搞完,后面还没搞好。下次来补

参考

大数据上课的笔记。

相关文章:

  • 【数模/预测】灰色预测
  • 基于KDtree的电路故障检测算法的MATLAB仿真(包括matlab仿真录像)
  • 奇妙的“黑板擦”字符串
  • 神经网络参数的学习-损失函数与梯度下降
  • Go(Golang)编程语言
  • 简单DIV CSS布局网站 (HTML学生个人网站作业设计) 体育运动主题网页设计与实现
  • 知识点18--springboot多模块开发
  • 沉睡者IT:零基础学习短视频与+玩转抖音快手
  • 【CSS】伪类选择器有什么用?有哪些是常用的伪类?
  • VirtualBox虚拟机安装教程
  • docker 镜像打包发布
  • MyBatis(详)
  • (附源码)计算机毕业设计SSM保险客户管理系统
  • Linux: 为root账户设置密码
  • 数组常用操作中np.delete用法
  • Android Volley源码解析
  • Angular6错误 Service: No provider for Renderer2
  • exports和module.exports
  • Java面向对象及其三大特征
  • JAVA之继承和多态
  • Meteor的表单提交:Form
  • React-redux的原理以及使用
  • windows下mongoDB的环境配置
  • 从0搭建SpringBoot的HelloWorld -- Java版本
  • 树莓派 - 使用须知
  • 为什么要用IPython/Jupyter?
  • 移动端唤起键盘时取消position:fixed定位
  • 正则学习笔记
  • 翻译 | The Principles of OOD 面向对象设计原则
  • 教程:使用iPhone相机和openCV来完成3D重建(第一部分) ...
  • (C语言)共用体union的用法举例
  • (Java)【深基9.例1】选举学生会
  • (Redis使用系列) SpringBoot 中对应2.0.x版本的Redis配置 一
  • (大众金融)SQL server面试题(1)-总销售量最少的3个型号的车及其总销售量
  • (附源码)springboot码头作业管理系统 毕业设计 341654
  • (附源码)计算机毕业设计SSM在线影视购票系统
  • (力扣)1314.矩阵区域和
  • (每日持续更新)信息系统项目管理(第四版)(高级项目管理)考试重点整理 第13章 项目资源管理(七)
  • (十一)JAVA springboot ssm b2b2c多用户商城系统源码:服务网关Zuul高级篇
  • (一)UDP基本编程步骤
  • (译) 理解 Elixir 中的宏 Macro, 第四部分:深入化
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • ***通过什么方式***网吧
  • .NET Core 将实体类转换为 SQL(ORM 映射)
  • .Net Core和.Net Standard直观理解
  • .NET 中 GetProcess 相关方法的性能
  • .net连接oracle数据库
  • .net之微信企业号开发(一) 所使用的环境与工具以及准备工作
  • .Net中wcf服务生成及调用
  • /etc/motd and /etc/issue
  • /usr/bin/python: can't decompress data; zlib not available 的异常处理
  • @autowired注解作用_Spring Boot进阶教程——注解大全(建议收藏!)
  • @基于大模型的旅游路线推荐方案
  • [ C++ ] 继承
  • [2]十道算法题【Java实现】