当前位置: 首页 > news >正文

Hadoop3.3.5的安装与单机/伪分布式配置

文章目录

      • 一、安装须知
      • 二、安装jdk
      • 三、安装shh
      • 四、安装配置hadoop
      • 五、运行hadoop

一、安装须知

本次安装的Hadoop版本为hadoop3.3.5。

在这之前完成了VMware虚拟软件的安装,并安装了Ubuntu22.04,在这基础上进行相关配置。

二、安装jdk

在Ubuntu中使用命令安装jdk,执行“sudo apt-get install openjdk-8-jdk”命令。

sudo apt-get install openjdk-8-jdk

安装jdk
等待安装完成后,使用‘java -version’检验是否安装成功。

java -version

jdk安装成功
因为是使用sudo命令安装的jdk,所以安装的jdk路径默认为“/lib/jvm/java-8-openjdk-amd64”,检查安装路径以及文件名称。
jdk安装路径
使用‘sudo getdit ~/.bashrc’命令打开环境文件,在文件顶部加入语句,使环境生效。

sudo getdit ~/.bashrc
export JAVA_HOME=/lib/jvm/java-8-openjdk-amd64
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

配置环境
使用‘source /.bashrc’使环境生效,用‘echo $JAVA_HOME’检验环境是否配置成功。

source /.bashrc
echo $JAVA_HOME

检验环境是否配置成功

三、安装shh

安装shh免密码登录,在终端输入‘sudo apt-get install ssh openssh-server’。

sudo apt-get install ssh openssh-server

安装ssh
安装完毕之后,在终端切换位置到ssh文件下,使用‘ssh-keygen -t rsa’命令生成SSH密钥对,用于进行身份验证。按照提示输入保存密钥的位置和文件名。生成密钥对后,将在当前目录下生成两个文件:私钥(id_rsa)和公钥(id_rsa.pub)。

ssh-keygen -t rsa

生成密钥
将本地计算机上的公钥复制到服务器上,检验是否配置成功。

cat id_rsa.pub>>authorized_keys
ssh localhost

检查ssh配置

四、安装配置hadoop

从清华镜像上下载haddop3.3.5的压缩包‘hadoop-3.3.5.tar.gz’,对文件夹进行解压缩。
清华镜像:https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/core/hadoop-3.3.5/
下载hadoop
文件解压后
配置相关文件,打开etc文件夹下的core-site.xml、hdfs-site.xml、hadoop-env.sh文件,加入语句后保存。
请注意,etc文件下还有一个hadoop,点进去之后如下图所示,后续配置添加的语句value当中要写hadoop的安装地址,建议在下图的文件目录下输入指令‘pwd’获取绝对路径,根据具体文件位置修改后续的配置语句。
在这里插入图片描述
在这里插入图片描述
配置core-site.xml文件,添加如下内容,注意value当中的tmp地址要与本机安装的hadoop地址一致。‘hdfs://localhost:9000’这一行当中的localhost默认指向本机地址,也可以在终端输入‘hostname’获取本机的名称,将这一行的‘localhost’换成本机名称,例如我的本机名称为‘lumos-virtual-machine’。
在这里插入图片描述

<configuration>
<property><name>hadoop.tmp.dir</name><value>file:/home/lumos/local/hadoop-3.3.5/tmp</value><description>Abase for other temporary directories.</description></property><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value>
</property>
</configuration>

配置core-site.xml
配置hdfs-site.xml文件,其内容如下,注意value当中的文件地址是否正确。

<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>file:/home/lumos/local/hadoop-3.3.5/tmp/dfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>file:/home/lumos/local/hadoop-3.3.5/tmp/dfs/data</value></property>
</configuration>

配置hdfs-site.xml
配置hadoop-env.sh文件,在终端相关位置输入“echo $JAVA_HOME/lib/jvm/java-8-openjdk-amd64”,配置后该文件如图所示

echo $JAVA_HOME/lib/jvm/java-8-openjdk-amd64

配置hadoop-env.sh

五、运行hadoop

开始运行hadoop,首先初始化hdfs系统,在之前解压后的hadoop3.3.5目录下使用‘bin/hdfd namenode -format’命令进行初始化。

bin/hdfd namenode -format

初始化HDFS系统
使用‘sbin/start-dfs.sh’指令开启NameNode和DataNode守护进程。如果此处报错,请检查之前配置的三个文件。

sbin/start-dfs.sh

开启成功的如下图所示:
在这里插入图片描述
使用‘jps’指令查看jps进程。
jps进程
关闭hadoop使用命令‘sbin/stop-dfs.sh’。
在浏览器输入‘http://localhost:9870’,成功打开网页如下图,可以查看NameNode和Datanode信息,还可以在线查看HDFS中的文件。
在这里插入图片描述
创建hadoop用户组,使用‘sudo useradd -m hadoop -s /bin/bash’命令以/bin/bash作为shell,使用‘sudo passwd hadoop’指令设置密码,使用‘sudo adduser hadoop sudo’添加hadoop至管理员权限。

sudo useradd -m hadoop -s /bin/bash

在这里插入图片描述
配置yarn,修改/etc下yarn-site.xml、mapred-site.xml文件。
首先修改yarn-site.xml文件,其中value的‘lumos-virtual-machine’是我虚拟机的本机名称,请根据自己的本机名称进行修改。
使用‘hostname’指令可以查看本机名称。
在这里插入图片描述

<configuration><property><name>yarn.resourcemanager.hostname</name><value>lumos-virtual-machine</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
</configuration>

修改yarn-site.xml
修改mapred-site.xml文件,其中value的‘lumos-virtual-machine’是我虚拟机的本机名称,请根据自己的本机名称进行修改。

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>mapreduce.jobhistory.address</name><value>lumos-virtual-machine:10020</value></property><property><name>mapreduce.jobhistory.webapp.address</name><value>lumos-virtual-machine:19888</value></property>
</configuration>

mapred-site.xml
输入命令‘sbin/start-yarn.sh’启动yarn,查看jps,可以看到多了NodeManager 和 ResourceManager两个后台进程。

sbin/start-yarn.sh

在这里插入图片描述
在浏览器中输入“主机名称:8088”,打开成功,结果如下图所示。
在这里插入图片描述
启动YARN后可以通过网页查看任务的运行情况,至此hadoop的单机运行已经完成。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【odoo17 | Owl】前端js钩子调用列表选择视图
  • 《昇思25天学习打卡营第25天|第28天》
  • 硅纪元视角 | 苹果AI训练数据大曝光,坚持用户隐私第一
  • C++(二叉树OJ题)
  • 【限免】频控阵雷达:概念、原理与应用【附MATLAB代码】
  • Windows搭建我的世界MC服务器 【Minecraft外网联机教程】
  • 轻松实现远程智能交互:OriginBot与钉钉和GPT4o的集成指南
  • 《计算机网络》(第8版)考研真题
  • Linux服务器安装Zabbix7.0客户端实战记录和问题记录
  • 批量打断相交线——ArcGIS 解决方法
  • Python 装饰器简单使用
  • 【设计模式】代理模式详解
  • TCP/IP 协议栈介绍
  • 什么是等保测评2.0,等保测评如何定级
  • Java面试八股之简述spring的自动装配
  • ES6指北【2】—— 箭头函数
  • $translatePartialLoader加载失败及解决方式
  • 【391天】每日项目总结系列128(2018.03.03)
  • ES学习笔记(12)--Symbol
  • IOS评论框不贴底(ios12新bug)
  • JavaScript类型识别
  • JS进阶 - JS 、JS-Web-API与DOM、BOM
  • Mocha测试初探
  • vue-router 实现分析
  • 工作手记之html2canvas使用概述
  • 记录一下第一次使用npm
  • 说说动画卡顿的解决方案
  • linux 淘宝开源监控工具tsar
  • ​LeetCode解法汇总307. 区域和检索 - 数组可修改
  • ​linux启动进程的方式
  • ​香农与信息论三大定律
  • ‌移动管家手机智能控制汽车系统
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (1)(1.11) SiK Radio v2(一)
  • (11)工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】
  • (12)目标检测_SSD基于pytorch搭建代码
  • (C语言)输入自定义个数的整数,打印出最大值和最小值
  • (编译到47%失败)to be deleted
  • (第8天)保姆级 PL/SQL Developer 安装与配置
  • (附源码)c#+winform实现远程开机(广域网可用)
  • (附源码)spring boot校园拼车微信小程序 毕业设计 091617
  • (附源码)springboot优课在线教学系统 毕业设计 081251
  • (十六)一篇文章学会Java的常用API
  • (四)鸿鹄云架构一服务注册中心
  • (转)Groupon前传:从10个月的失败作品修改,1个月找到成功
  • (转载)深入super,看Python如何解决钻石继承难题
  • ***通过什么方式***网吧
  • .net 程序 换成 java,NET程序员如何转行为J2EE之java基础上(9)
  • .Net程序猿乐Android发展---(10)框架布局FrameLayout
  • .net开源工作流引擎ccflow表单数据返回值Pop分组模式和表格模式对比
  • .Net实现SCrypt Hash加密
  • @entity 不限字节长度的类型_一文读懂Redis常见对象类型的底层数据结构
  • @property括号内属性讲解
  • @selector(..)警告提示
  • [ CTF ]【天格】战队WriteUp- 2022年第三届“网鼎杯”网络安全大赛(青龙组)