当前位置: 首页 > news >正文

大数据前置学习基础准备(非常详细!)

1.需要的环境

        需要3台服务器,centos7

为集群,全部设置为nat模式

2.整个环境大体

1.设置三台Linux虚拟机的主机和固定ip

2.在Linux系统以及本机系统中配置了主机名映射

3.配置了三台服务器之间root用户的ssh免密互通

4.安装配置JDK环境

5.关闭防火墙和SELinux

6.更新时区和同步时间

7.拍摄快照

3.修改主机名,配置静态ip

vim /etc/hostanme

将里面的内容修改为root1,其他的机器以此类推root2,root3

设置固定ip地址,三台机器设置同一个网段,并且ip相连

vim /etc/sysconfig/network-scripts/ifcfg-ens33

修改后进行网卡重启

Systemctl restart network

4.配置Linux主机名映射

配置3台linux的/etc/hosts

配置这个原因就是之后再远程连接工具中只输入主机名就好了《例如

5.配置windows主机名映射

在windows系统中修改host文件,填入如下内容:
windows路径为C:\Windows\System32\drivers\etc下的hosts文件中添加ip和用户名

或者直接win+r输入system32

6.配置ssh免密登录

后续安装的集群化软件,多数需要远程登录以及远程执行命令,我们可以简单起见,配置三台Linux服务器之间的免密码互相ssh登录

1.首先在每一台机器中执行ssh-keygen -t rsa -b 4096 一直回车就好了(rsa是密钥,4096是4096位的密码)

2.再在每一台机器中执行ssh-copy-id root1,ssh-copy-id root2,ssh-copy-id root3

全部执行完毕后就root1,root2,root3用户之间就能免密互通,直接ssh root2就能切换到root2,其他也一样

创建hadoop用户并配置免密登录

后续大数据的软件,将不会以root用户启动(主要是确保安全,要是被黑客攻击了就不会是root权限,养成良好习惯)

1.在每台机器上执行useradd hadoop创建hadoop用户

2.在每一台机器上执行passwd hadoop,设置hadoop用户密码123456

3.每一台机器都切换到hadoop用户,su hadoop,并且执行ssh-keygen -t rsa -b 4096,创建ssh密钥

4.在每台机器上执行ssh-copy-id root1,ssh-copy-id root2,ssh-copy-id root3,现在也是一样能互通了

7.配置JDK环境

1.创建文件夹,用来部署JDK,将JDK和

Mkdir -p /export/server

上传jdk文件到服务器上,我用的是finalshell,直接拖进去

2.解压缩到这个export/server中

3.配置软链接

4.配置JAVA_HOME环境变量

加这两条

执行命令,让环境变量生效

将之前系统自带的java环境删除,将我们刚刚安装的创建一个软链接到系统目录下

执行命令验证,java -version,javac

另外的两台机器也是一样,使用远程复制过去java,之后配置环境变量

对三台虚拟机完成防火墙,SElinux,时间同步等系统设置

8.关闭防火墙和SELinux

集群化软件之间需要通过端口互相通讯,为了避免出现网络不通的问题,我们可以简单的在集群内部关闭防火墙

Linux有一个安全模块:SELinux,用以限制用户和程序的相关权限,来确保系统的安全稳定

在当前,我们需要关闭SELinux功能,避免导致后面的软件运行出现问题

编辑文件修改

重启才能生效

9.修改时间地区配置自动时间同步

1.安装ntp软件

yum install -y ntp

2.更新时区

rm -f /etc/localtime;sudo In -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

3.同步时间

ntpdate -u ntp.aliyun.com

4.开启ntp服务并设置开机自启

systemctl start ntpd

systemctl enable ntpd

最后拍摄快照,防止之后出现问题

相关文章:

  • 设计模式——观察者模式(Observer Pattern)+ Spring相关源码
  • 汽车托运如何确保安全
  • 企业工程项目管理系统源码(三控:进度组织、质量安全、预算资金成本、二平台:招采、设计管理)
  • 【蓝桥杯 第十四届省赛Java B组】真题训练(A - C)正在更新
  • 什么是神经网络,它的原理是啥?(1)
  • C++二分查找算法的应用:俄罗斯套娃信封问题
  • 开发环境配置之Linux安装golang
  • 【vscode】Window11环境下vscode使用Fira Code字体【教程】
  • 【快刊推荐】EI快刊盘点,仅29天录用,国人友好,接收领域广!
  • Qt 6 MinGW使用GSL库的方法
  • win10 + vs2017 + cmake3.17 编译 curl-7.48
  • 使用 OpenSSL 工具撰写 Bash 脚本进行密码明文的加密与解密
  • 用Go实现两个线程交替打印奇数和偶数
  • VS Code开发Java之快速入门
  • AI智能语音识别模块(二)——基于Arduino的语音控制MP3播放器
  • Android 控件背景颜色处理
  • CentOS7简单部署NFS
  • JavaScript 无符号位移运算符 三个大于号 的使用方法
  • Mysql数据库的条件查询语句
  • Puppeteer:浏览器控制器
  • Theano - 导数
  • vue2.0项目引入element-ui
  • 多线程 start 和 run 方法到底有什么区别?
  • 关键词挖掘技术哪家强(一)基于node.js技术开发一个关键字查询工具
  • 坑!为什么View.startAnimation不起作用?
  • 前端代码风格自动化系列(二)之Commitlint
  • 手写双向链表LinkedList的几个常用功能
  • 听说你叫Java(二)–Servlet请求
  • 小程序开发之路(一)
  • 小试R空间处理新库sf
  • 运行时添加log4j2的appender
  • d²y/dx²; 偏导数问题 请问f1 f2是什么意思
  • 如何通过报表单元格右键控制报表跳转到不同链接地址 ...
  • ​2021半年盘点,不想你错过的重磅新书
  • #define、const、typedef的差别
  • #每日一题合集#牛客JZ23-JZ33
  • (Matalb时序预测)WOA-BP鲸鱼算法优化BP神经网络的多维时序回归预测
  • (附源码)springboot青少年公共卫生教育平台 毕业设计 643214
  • (十二)python网络爬虫(理论+实战)——实战:使用BeautfulSoup解析baidu热搜新闻数据
  • (终章)[图像识别]13.OpenCV案例 自定义训练集分类器物体检测
  • (转) 深度模型优化性能 调参
  • (转)菜鸟学数据库(三)——存储过程
  • (转载)Google Chrome调试JS
  • ***详解账号泄露:全球约1亿用户已泄露
  • .NET Compact Framework 3.5 支持 WCF 的子集
  • .NET Core 将实体类转换为 SQL(ORM 映射)
  • .NET4.0并行计算技术基础(1)
  • .net6解除文件上传限制。Multipart body length limit 16384 exceeded
  • .net打印*三角形
  • .NET精简框架的“无法找到资源程序集”异常释疑
  • .NET正则基础之——正则委托
  • @ModelAttribute注解使用
  • []sim300 GPRS数据收发程序
  • [C#C++]类CLASS
  • [C#基础知识系列]专题十七:深入理解动态类型