当前位置：首页 > news >正文

Windows下安装Hadoop(引导版)

news 来源：原创 2024/9/29 3:30:40

Windows下安装Hadoop(引导版)

本环境只作为测试环境的搭建和学习使用

参考文档

环境：
首先确定环境为java1.8 或者hadoop适配的版本
cmd java -version查看
hadoop环境变量可以不用设置
关于hdfs的配置可以自行修改目录

具体的安装方式参考下面的两个文档

下载软件包
Hadoop3.1.0版本的安装包：https://archive.apache.org/dist/hadoop/common/hadoop-3.1.0/hadoop-3.1.0.tar.gz
Windows环境安装所需的bin文件包（我们这里选择3.1.0）：
1、可以打开地址：https://gitee.com/nkuhyx/winutils ，里面选 3.1.0。
2、或者直接下载：https://gitee.com/tttzzzqqq/apache-hadoop-3.1.0-winutils
原文链接：https://blog.csdn.net/tttzzzqqq2018/article/details/131928028

注意在替换bin文件时选择重复的文件跳过

hadoop软件包的解压方式
start winrar x -y hadoop-3.3.2.tar.gz ./

参考链接：
https://blog.csdn.net/Helen_1997_1997/article/details/136627713

配置文件

文件目录在hadoop etc下

core-site.xml

<configuration>
<property><name>fs.default.name</name><value>hdfs://localhost:9000</value></property>
</configuration>

hdfs-site.xml

<configuration><!-- 这个参数设置为1，因为是单机版hadoop --><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>/D:/develop/hadoop/hadoop-3.1.0/data/namenode</value></property><property><name>dfs.datanode.data.dir</name><value>D:/develop/hadoop/hadoop-3.1.0/data/datanode</value></property>
</configuration>

yarn-site.xml
注意：yarn的资源可以小一点发现过大的资源分配启动的话 yarn页面访问不到

<configuration><!-- Site specific YARN configuration properties --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hahoop.mapred.ShuffleHandler</value></property><!-- 指定ResourceManager的地址--><!--property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property--><!-- 环境变量的继承 --><property><name>yarn.nodemanager.env-whitelist</name><value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value></property><!-- yarn容器允许分配的最大最小内存 --><property><name>yarn.scheduler.minimum-allocation-mb</name><value>512</value></property><property><name>yarn.scheduler.maximum-allocation-mb</name><value>4096</value></property><!-- yarn容器允许管理的物理内存大小 标配12G--><property><name>yarn.nodemanager.resource.memory-mb</name><value>4096</value></property><!--启用自动检测cpu核数--><!--YARN可使用的虚拟CPU个数，默认是8 此参数配合自动检测--><property><name>yarn.nodemanager.resource.cpu-vcores</name><value>4</value></property><!--单个任务可申请的最小虚拟CPU个数，默认是1--><property><name>yarn.scheduler.minimum-allocation-vcores</name><value>1</value></property><!--资源设定参数对于开启动态资源分配的设定无效--><!--单个任务可申请的最多虚拟CPU个数，默认是4) 指定为8核心--><property><name>yarn.scheduler.maximum-allocation-vcores</name><value>4</value></property><!-- 关闭yarn对物理内存和虚拟内存的限制检查 --><property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value></property><property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value></property><!-- 开启日志聚集功能 --><property><name>yarn.log-aggregation-enable</name><value>true</value></property><!-- 设置日志保留时间为7天 --><property><name>yarn.log-aggregation.retain-seconds</name><value>604800</value></property></configuration>

mapred-site.xml

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>mapred.job.tracker</name><value>hdfs://localhost:9001</value></property>
</configuration>

workers

localhost

hadoop-env.cmd

@rem The java implementation to use.  Required.
set JAVA_HOME=D:\develop\java\jdk1.8.0_202

hadoop-env.sh

export JAVA_HOME=D:\develop\java\jdk1.8.0_202

查看服务状态

使用jps

在这里插入图片描述

hdfs页面
在这里插入图片描述

yarn页面
在这里插入图片描述

出现的报错和解决

Exception in thread “main” java.lang.IllegalArgumentException: Invalid URI for NameNode address (check fs.defaultFS): file:/// has no authority.
启动不了nameNode，解决方法：

在hadoop文件夹\hadoop-3.0.2\etc\hadoop\core-site.xml的标签下，添加如下内容

<property><name>fs.default.name</name><value>hdfs://localhost:9000</value></property>

原文链接：https://blog.csdn.net/qq_37475168/article/details/90749924

有时候启动或者初始化元数据会出现目录无法识别的状况
可以把D前面的/删除试一试
要查看报错内容
在这里插入图片描述

python-鸡兔同笼问题：已知鸡和兔的总头数与总脚数。求笼中鸡和兔各几只？

CSP模板生成系统

三维科技云展厅如何突破传统展览的局限，赋能企业高效展示

linux常用命令之大数据平台搭建版

[CocosCreator]Android的增加AndroidX的动态权限

【JavaScript寻宝之旅】var和let的区别

图书管理系统(Java版本)

如何进行前端职业规划

小红书-社区搜索部 (NLP、CV算法实习生) 一面面经

宝藏网站推荐-封面图片生成器

芯课堂 | UI Creator 物理键盘移植指南

element ui 的密码输入框点击显示隐藏密码时，图标随之改变

Mysql之基本架构

信息系统项目管理师--八大绩效域-不确定性绩效域

1701java药品进销存管理系统Myeclipse开发sqlserver数据库web结构java编程计算机网页项目

bearychat的java client

If…else

Java 网络编程（2）：UDP 的使用

Median of Two Sorted Arrays

mongodb--安装和初步使用教程

Node.js 新计划：使用 V8 snapshot 将启动速度提升 8 倍

node-glob通配符

python 装饰器（一）

react-native 安卓真机环境搭建

tensorflow学习笔记3——MNIST应用篇

Yeoman_Bower_Grunt

zookeeper系列（七）实战分布式命名服务

前端存储 - localStorage

使用parted解决大于2T的磁盘分区

微信支付JSAPI，实测！终极方案

带你开发类似Pokemon Go的AR游戏

好程序员大数据教程Hadoop全分布安装（非HA)

# .NET Framework中使用命名管道进行进程间通信

#FPGA（基础知识）

#如何使用 Qt 5.6 在 Android 上启用 NFC

$(selector).each()和$.each()的区别

(13)Latex：基于ΤΕΧ的自动排版系统——写论文必备

（2024.6.23）最新版MAVEN的安装和配置教程（超详细）

（Redis使用系列） SpringBoot 中对应2.0.x版本的Redis配置一

(Ruby)Ubuntu12.04安装Rails环境

（笔试题）合法字符串

（第61天）多租户架构（CDB/PDB）

（二）Linux——Linux常用指令

（机器学习-深度学习快速入门）第一章第一节：Python环境和数据分析

(十三)Maven插件解析运行机制

（算法）Game

（一一四）第九章编程练习

(中等) HDU 4370 0 or 1，建模+Dijkstra。

.NET 8 跨平台高性能边缘采集网关

.NET Compact Framework 3.5 支持 WCF 的子集

.NET Entity FrameWork 总结，在项目中用处个人感觉不大。适合初级用用，不涉及到与数据库通信。

.NET 的程序集加载上下文

@RequestParam @RequestBody @PathVariable 等参数绑定注解详解

[ 网络基础篇 ] MAP 迈普交换机常用命令详解

参考文档

配置文件

查看服务状态

出现的报错和解决

相关文章：