当前位置：首页 > news >正文

龙蜥anolis8.9安装hadoop3.3.6伪分布环境

news 来源：原创 2024/9/19 21:26:04

声明：这是自用验证的过程记录，都经过个人验证的，运行应该无问题，但是个人认为简单的，没有进行解释，文章阅读需要一定的基础。文章参考了同事的文档，环境基于anolis8.9环境。
1、安装anolis 8.9
配置4u处理器+4G内存+100G硬盘
设置机器名为 master
修改名字可以用：

hostnamectl set-hostname master

为了保险起见，可以在/etc/hosts中增加相关主机的ip与机器名的配置，比如我这里：
192.168.6.19 master

关闭防火墙:
systemctl stop firewalld
关闭防火墙开机自启:
systemctl disable firewalld

2、官网下载hadoop的安装包，Binary download
https://hadoop.apache.org/releases.html
3.3.6的下载：
https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
国内镜像，下载hadoop-3.3.6.tar.gz：

https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/core/hadoop-3.3.6/

3、去下载openjdk

https://adoptium.net/zh-CN/temurin/releases/?version=8

4、anolis 需要先安装tar

yum install tar -y

如果要用vim也需要安装

yum install vim -y

编辑器也可以用nano,我更习惯这个

yum install nano -y

5、文件上传到/root下。
6、创建app目录 mkdir /app
7、解压缩并移动至/app

tar zxvf OpenJDK8U-jdk_x64_linux_hotspot_8u422b05.tar.gz
mv jdk8u422-b05/ /app/openjdk-8tar zxvf hadoop-3.3.6.tar.gz
mv hadoop-3.3.6 /app/hadoop-3

8、切换到/app确认目录是否正常，openjdk-8 hadoop-3
9、设置环境
vi /etc/profile
增加：

export JAVA_HOME=/app/openjdk-8
export HADOOP_HOME=/app/hadoop-3
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

保存后执行，source /etc/profile 更新环境变量
10、验证环境变量

java -version
hadoop version

11、进入 /app/hadoop-3/etc/hadoop/

cd /app/hadoop-3/etc/hadoop/

下面需要修改的文件都在该目录下。
12、修改配置文件
①nano core-site.xml

<configuration>
<property><name>fs.defaultFS</name><value>hdfs://master:8020</value></property><property><name>hadoop.tmp.dir</name><value>/var/log/hadoop/tmp</value></property>
</configuration>

②nano mapred-site.xml

<configuration><!-- Framework name --><property><name>mapreduce.framework.name</name><value>yarn</value></property><!-- Job history properties --><property><name>mapreduce.jobhistory.address</name><value>master:10020</value></property><property><name>mapreduce.jobhistory.webapp.address</name><value>master:19888</value></property><property><name>yarn.app.mapreduce.am.env</name><value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value></property><property><name>mapreduce.map.env</name><value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value></property><property><name>mapreduce.reduce.env</name><value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value></property>
</configuration>

③ nano yarn-site.xml

<configuration><!-- Site specific YARN configuration properties --><!-- 指定YARN ResourceManager的主机名，通常是集群的主节点 --><property><name>yarn.resourcemanager.hostname</name><value>master</value></property><!-- ResourceManager的RPC服务地址 --><property><name>yarn.resourcemanager.address</name><value>${yarn.resourcemanager.hostname}:8032</value></property><!-- ResourceManager的调度器地址，用于任务调度 --><property><name>yarn.resourcemanager.scheduler.address</name><value>${yarn.resourcemanager.hostname}:8030</value></property><!-- ResourceManager的Web应用程序地址，用于浏览集群状态 --><property><name>yarn.resourcemanager.webapp.address</name><value>${yarn.resourcemanager.hostname}:8088</value></property><!-- ResourceManager的Web应用程序HTTPS地址，启用安全连接时使用 --><property><name>yarn.resourcemanager.webapp.https.address</name><value>${yarn.resourcemanager.hostname}:8090</value></property><!-- ResourceManager的资源跟踪服务地址，节点管理器向该地址报告资源信息 --><property><name>yarn.resourcemanager.resource-tracker.address</name><value>${yarn.resourcemanager.hostname}:8031</value></property><!-- ResourceManager的管理接口地址，用于管理和控制集群 --><property><name>yarn.resourcemanager.admin.address</name><value>${yarn.resourcemanager.hostname}:8033</value></property><!-- NodeManager本地存储临时文件的目录 --><property><name>yarn.nodemanager.local-dirs</name><value>/data/hadoop/yarn/local</value></property><!-- 是否启用日志聚合，将节点上的日志收集到一个中心位置 --><property><name>yarn.log-aggregation-enable</name><value>true</value></property><!-- 存储应用程序日志的远程目录 --><property><name>yarn.nodemanager.remote-app-log-dir</name><value>/data/tmp/logs</value></property><!-- 日志服务器的URL，用于访问应用程序的历史日志 --><property><name>yarn.log.server.url</name><value>http://master:19888/jobhistory/logs/</value></property><!-- 是否启用虚拟内存检查，可以防止内存超用，但可能会影响任务运行 --><property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value></property><!-- 定义NodeManager的辅助服务，mapreduce_shuffle是MapReduce任务所需的服务 --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><!-- 配置ShuffleHandler类，处理MapReduce Shuffle操作 --><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property><!-- 配置NodeManager节点上可用的内存（以MB为单位） --><property><name>yarn.nodemanager.resource.memory-mb</name><value>2048</value></property><!-- 调度器允许分配的最小内存大小 --><property><name>yarn.scheduler.minimum-allocation-mb</name><value>512</value></property><!-- 调度器允许分配的最大内存大小 --><property><name>yarn.scheduler.maximum-allocation-mb</name><value>4096</value></property><!-- Map任务分配的内存大小 --><property><name>mapreduce.map.memory.mb</name><value>2048</value></property><!-- Reduce任务分配的内存大小 --><property><name>mapreduce.reduce.memory.mb</name><value>2048</value></property><!-- 配置NodeManager可用的CPU核心数 --><property><name>yarn.nodemanager.resource.cpu-vcores</name><value>1</value></property>
</configuration>

④、nano hdfs-site.xml

<configuration><!-- NameNode directory --><property><name>dfs.namenode.name.dir</name><value>file:///data/hadoop/hdfs/name</value></property><!-- DataNode directory --><property><name>dfs.datanode.data.dir</name><value>file:///data/hadoop/hdfs/data</value></property><!-- Allow HTTP access to NameNode --><property><name>dfs.namenode.secondary.http-address</name><value>master:50090</value></property><!-- Replication factor --><property><name>dfs.replication</name><value>3</value></property><property><name>dfs.webhdfs.enabled</name><value>true</value>
</property></configuration>

⑤ nano hadoop-env.sh 增加java_HOME的配置

export JAVA_HOME=/app/openjdk-8

⑥ nano yarn-env.sh 增加java_HOME的配置

export JAVA_HOME=/app/openjdk-8

13、格式化namenode

hdfs namenode -format

14、继续修改启动、停止脚本

cd /app/hadoop-3/sbin/

①修改文件 nano start-dfs.sh 最开始增加内容：

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

②修改文件 nano stop-dfs.sh
增加内容：

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

③修改文件 nano start-yarn.sh
增加内容：

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

④修改文件 nano stop-yarn.sh
增加内容：

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

15、创建免密登录,必做，这个是hadoop集群用的

ssh-keygen -t rsa
ssh-copy-id master

16、启动集群

start-dfs.sh
start-yarn.sh
mr-jobhistory-daemon.sh start historyserver

17、验证：
jps 命令
http://192.168.6.19:9870/ web页面
http://192.168.6.19:8088/ yarn的web页面
http://192.168.6.19:19888/ Historyserver的web页面

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

从Prompt到创造：解锁AI的无限潜能

京东商品详情的 API 探秘与应用

p14 使用阿里云服务器的docker部署NGINX

艾迈斯欧司朗亮相2024 CIOE，多款创新产品引领光电新潮

开发小程序

【软件测试】认识测试

架构理论碰撞：对比TOGAF、Zachman、DODAF和FEAF等主流架构框架

【搜索算法】以扩召回为目标，item-tag不如query-tag能扩更多数量

堆排序，快速排序

【系统架构设计师】特定领域软件架构（经典习题）

Java多线程3

完结马哥教育SRE课程--服务篇

@RequestMapping 和 @GetMapping等子注解的区别及其用法

UAC2.0 麦克风——双声道 USB 麦克风（16bit）

阿里云盘惊现“一锅端“的 Bug，我刚充的钱啊！

JavaScript/HTML5图表开发工具JavaScript Charts v3.19.6发布【附下载】

Javascript编码规范

Java面向对象及其三大特征

magento 货币换算

QQ浏览器x5内核的兼容性问题

SAP云平台里Global Account和Sub Account的关系

Vim Clutch | 面向脚踏板编程……

vuex 笔记整理

编写高质量JavaScript代码之并发

官方解决所有 npm 全局安装权限问题

微信小程序开发问题汇总

原生Ajax

Nginx实现动静分离

基于django的视频点播网站开发-step3-注册登录功能 ...

GitLab 之 GitLab-Runner 安装，配置与问题汇总

3ds Max插件CG MAGIC图形板块为您提升线条效率！

# 利刃出鞘_Tomcat 核心原理解析（八）-- Tomcat 集群

#LLM入门|Prompt#1.7_文本拓展_Expanding

#Spring-boot高级

（51单片机）第五章-A/D和D/A工作原理-A/D

（PHP）设置修改 Apache 文件根目录 (Document Root)（转帖）

（ZT）一个美国文科博士的YardLife

（八十八）VFL语言初步 - 实现布局

（附源码）ssm旅游企业财务管理系统毕业设计 102100

(收藏）Git和Repo扫盲——如何取得Android源代码

（学习日记）2024.04.04：UCOSIII第三十二节：计数信号量实验

（一）C语言之入门：使用Visual Studio Community 2022运行hello world

（一）Mocha源码阅读: 项目结构及命令行启动

(原創) 是否该学PetShop将Model和BLL分开? (.NET) (N-Tier) (PetShop) (OO)

（转）iOS字体

(转)Java socket中关闭IO流后，发生什么事？（以关闭输出流为例） .

***检测工具之RKHunter AIDE

.NET : 在VS2008中计算代码度量值

.net framework4与其client profile版本的区别

.NET/C# 异常处理：写一个空的 try 块代码，而把重要代码写到 finally 中（Constrained Execution Regions）

.Net的DataSet直接与SQL2005交互

::前边啥也没有

@JoinTable会自动删除关联表的数据

@NoArgsConstructor和@AllArgsConstructor,@Builder

@Pointcut 使用

相关文章：