当前位置: 首页 > news >正文

Hadoop的安装和使用-2024年08月01日

Hadoop的安装和使用-2024年08月01日

  • 1.创建Hadoop用户
  • 2.SSH登陆权限设置
  • 3.java的安装
  • 4.Hadoop单机安装配置
  • 5.Hadoop伪分布式安装配置

1.创建Hadoop用户

如果安装Ubuntu的时候不是用的“hadoop”用户,那么需要增加一个名为 hadoop的用户首先按ctrl+alt+t打开终端窗口,输入如下命令创建新用户

$ sudo useradd -m hadoop -s /bin/bash

上面这条命令创建了可以登陆的hadoop 用户,并使用/bin/bash 作为shell接着使用如下命令设置密码,可简单设置为hadoop,按提示输入两次密码,密码不能够包括用户名,不能太简单,不能少于8位,不能使用password作为密码。

$ sudo passwd hadoop

可为hadoop用户增加管理员权限,方便部署,避免一些对新手来说比较棘手的权限问题,这一步执行完一定他要显示正在将hadoop加入。。。即为成功

$ sudo adduser hadoop sudo

在这里插入图片描述

hadoop账户创建成功后,切换当前用户至hadoop,再继续往下操作注意注意

2.SSH登陆权限设置

SSH为Secure Shell的缩写,是建立在应用层和传输层基础上的安全协议。SSH是目前较可靠、专为远程登录会话和其他网络服务提供安全性的协议。
SSH是由客户端和服务端的软件组成,服务端是一个守护进程(daemon),它在后台运行并响应来自客户端的连接请求,客户端包含ssh程序以及像scp(远程拷贝)、slogin(远程登陆)、sftp(安全文件传输)等其他的应用程序

1.安装vim

$sudo apt-get install vim

在这里插入图片描述

2.下载SSH服务端和客户端

$sudo apt-get install openssh-server

在这里插入图片描述

3.登录本机

$ssh localhost   //输入 'yes',登录本机,每次登录都需密码

在这里插入图片描述

4.配置无密码登录

$exit      //退出登录
$cd  ~/.ssh/ //切换到ssh目录
$ssh-keygen -t rsa //生成密钥,之后在这会按几次回车,看下图
$cat ./id_rsa.pub >> ./authorized_keys //将密钥添加到公钥中

在这里插入图片描述在这里插入图片描述

5.无密码登录

$ssh localhost  //本次登录无需输入密码

3.java的安装

Java环境可选择Oracle的JDK,或是OpenJDK可以在Ubuntu中直接通过命令安装OpenJDK8
1.首先更新下包

sudo apt update

2.安装jdk1.8

sudo apt install openjdk-8-jdk

3.验证安装

java -version

在这里插入图片描述
4.查看你安装目录

update-alternatives --list java

在这里插入图片描述
5.将 Java 可执行文件的路径添加到 PATH 环境变量中:

echo 'export PATH="$PATH:/usr/lib/jvm/java-8-openjdk-amd64/bin"' >> ~/.bashrc
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/jre

6.重新加载环境变量

source ~/.bashrc

7.pwd查看自己当前路径
在这里插入图片描述
8.在此目录下新建一个文本,写个简单的java代码,做测试

public class test {public static void main(String[] args) {for(int i = 0; i < 10; i++) {System.out.print(i);}}
}

9.修改格式为java文件
在这里插入图片描述

10.打开命令终端 ctrl+alt+t,执行编译命令,代码没错的情况下,会在同目录下多一个文件叫test.class

javac test.java

在这里插入图片描述
11.执行编译文件

java test

在这里插入图片描述
12.至此安装及检测完成

4.Hadoop单机安装配置

1.用linux自带的firefox浏览器访问Hadoop官网,从Apach官网上下载Hadoop 2.10.2版本
https://downloads.apache.org/hadoop/common/hadoop-2.10.2/hadoop-2.10.2.tar.gz
在这里插入图片描述
这里可以看到下载的非常慢,可以使用国内镜像下载
https://downloads.apache.org/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz
在这里插入图片描述
2.解压安装Hadoop2.10.2

$cd ~/下载  //切换到Hadoop安装包的位置
$sudo tar -zxf  hadoop-2.10.2.tar.gz -C /usr/local   //将Hadoop解压到/usr/local目录下
$cd /usr/local
$sudo mv ./hadoop-2.10.1/ ./hadoop     //将目录名改为hadoop
$sudo chown -R hadoop ./hadoop         //修改目录权限

在这里插入图片描述
3.检查是否可用

$ cd /usr/local/hadoop
$ ./bin/hadoop version

显示下图即为成功,如果显示JAVA_HOME找不到,自己回到上面重新配置java的path
在这里插入图片描述
4.将hadoop配置环境变量

$sudo vim ~/.bashrc  //打开环境变量目录写入export HADOOP_HOME=/usr/local/hadoop
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"
export PATH=${JAVA_HOME}/bin:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH

在这里插入图片描述
5.查看Hadoop版本信息

$hadoop version   //查看版本信息

在这里插入图片描述

5.Hadoop伪分布式安装配置

1.跳转目录

cd /usr/local/hadoop/etc/hadoop

2.修改 core-site.xml

<configuration><property><name>hadoop.tmp.dir</name><value>file:/usr/local/hadoop/tmp</value><description>Abase for other temporary directories.</description></property><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property>
</configuration>

3.修改 hdfs-site.xml

<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>file:/usr/local/hadoop/tmp/dfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>file:/usr/local/hadoop/tmp/dfs/data</value></property>
</configuration>

4.关闭搜友命令窗口,重新打开命令窗,做格式化并启动

/usr/local/hadoop/bin/hdfs namenode -format

执行后会又一大堆字符,看到has been successfully …,即为成功

5.然后启动全部进程:
start-all.sh

这里可能出现找不到java_home报错,但是执行java -version又可以显示
在这里插入图片描述
此时方法为:修改hadoop-env.sh 文本路径为:

/usr/local/hadoop/etc/hadoop/hadoop-env.sh

里面有个

export JAVA_HOME=${JAVA_HOME}
把这一行改为:
export JAVA_HOME=你javahome的绝对路径即可

6.启动成功图
在这里插入图片描述
7.浏览器打开http://localhost:50070可以看到
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 初识C++ · 哈希表封装unordered_map/set
  • 新版pacs超声科工作量
  • IAP 程序升级原理解析
  • [网鼎杯2018]Unfinish解题,五分钟带你解题
  • 分享 | 某外资保险集团进一步提升数字身份管理水平 有助于中国业务的高速发展
  • 如何把uniapp 项目发布成Andriod App的流程
  • 【优秀python 数据分析案例】基于python的穷游网酒店数据采集与可视化分析的设计与实现
  • arthas的tt命令
  • ESP32在ESP-IDF环境下禁用看门狗
  • 【STL】 vector的底层实现
  • MongoDB基础【学习笔记】
  • Linux文件或图片名称中文乱码解决【适用于centos、ubuntu等系统】
  • MATLAB中“varargin”的作用
  • TCL 实业 x TiDB丨从分销转向零售,如何考虑中台建设和数据库选型?
  • 《Techporters架构搭建》-Day04 基础架构
  • 时间复杂度分析经典问题——最大子序列和
  • 【跃迁之路】【519天】程序员高效学习方法论探索系列(实验阶段276-2018.07.09)...
  • emacs初体验
  • javascript面向对象之创建对象
  • JSDuck 与 AngularJS 融合技巧
  • magento2项目上线注意事项
  • Next.js之基础概念(二)
  • SegmentFault 2015 Top Rank
  • SpiderData 2019年2月16日 DApp数据排行榜
  • SpriteKit 技巧之添加背景图片
  • 后端_MYSQL
  • 互联网大裁员:Java程序员失工作,焉知不能进ali?
  • 目录与文件属性:编写ls
  • 前端面试题总结
  • 入门级的git使用指北
  • 入手阿里云新服务器的部署NODE
  • 怎么把视频里的音乐提取出来
  • 正则表达式小结
  • No resource identifier found for attribute,RxJava之zip操作符
  • # 达梦数据库知识点
  • #LLM入门|Prompt#1.8_聊天机器人_Chatbot
  • (1)(1.13) SiK无线电高级配置(五)
  • (aiohttp-asyncio-FFmpeg-Docker-SRS)实现异步摄像头转码服务器
  • (day 2)JavaScript学习笔记(基础之变量、常量和注释)
  • (Java实习生)每日10道面试题打卡——JavaWeb篇
  • (Note)C++中的继承方式
  • (SERIES12)DM性能优化
  • (ZT) 理解系统底层的概念是多么重要(by趋势科技邹飞)
  • (接口自动化)Python3操作MySQL数据库
  • (完整代码)R语言中利用SVM-RFE机器学习算法筛选关键因子
  • (一)为什么要选择C++
  • .equal()和==的区别 怎样判断字符串为空问题: Illegal invoke-super to void nio.file.AccessDeniedException
  • .NET Core IdentityServer4实战-开篇介绍与规划
  • .net dataexcel winform控件 更新 日志
  • .NET/MSBuild 中的发布路径在哪里呢?如何在扩展编译的时候修改发布路径中的文件呢?
  • .NET值类型变量“活”在哪?
  • .sh 的运行
  • [Android]将私钥(.pk8)和公钥证书(.pem/.crt)合并成一个PKCS#12格式的密钥库文件
  • [Android]一个简单使用Handler做Timer的例子
  • [Angular] 笔记 18:Angular Router