当前位置: 首页 > news >正文

Hue在大数据生态圈的集成

1. 写在前面

        工欲善其事,必先利其器,网上教程往往让你安装一半丈二和尚摸不着头脑

        其他方法安装遇到错误亦可能可在本文的思路中找到答案

        本文安装环境CentOS 7

        安装目录  /export/server

        软件包存放位置 /export/software

        已安装好Hadoop3.3.2、Hive3.1.2、Kafka2.12-3.2.1等,可查看专栏其他文章

2. hue可视化

        hue在大数据生态圈的可视化功能的方便性,不用多言,下面开始集成各大组件

        未安装hue的小伙伴可以查看教小白白Hue安装部署_不图安逸的小码农的博客-CSDN博客

3. HDFS集成

3.1 HDFS方面

1)node1上core-site.xml修改

#core-site.xml路径
cd /export/server/hadoop-3.3.2/etc/hadoop/

#这是系统编辑器,我更习惯notepad++编辑
vim core-site.xml

notepad++如何连接编辑参考此文内容教小白30分钟实现分库分表_不图安逸的小码农的博客-CSDN博客

增加以下内容

<!--允许通过httpfs方式访问hdfs的主机名 HUE-->
<property>
    <name>hadoop.proxyuser.root.hosts</name>
    <value>*</value>
</property>
<!--允许通过httpfs方式访问hdfs的用户组 HUE-->
<property>
    <name>hadoop.proxyuser.root.groups</name>
    <value>*</value>
</property>
#将node1配置好的core-site.xml复制给node2\node3
scp -r core-site.xml node2:/export/server/hadoop-3.3.2/etc/hadoop/

scp -r core-site.xml node3:/export/server/hadoop-3.3.2/etc/hadoop/

2)node1上hdfs-site.xml修改

#hdfs-site.xml路径
cd /export/server/hadoop-3.3.2/etc/hadoop/

#这是系统编辑器,我更习惯notepad++编辑
vim hdsf-site.xml

增加以下内容

<!-- HUE 外部访问-->
<property>
	<name>dfs.webhdfs.enabled</name>
	<value>true</value>
</property>
 #将node1配置好的hdfs-site.xml复制给node2\node3
 scp -r hdfs-site.xml node2:/export/server/hadoop-3.3.2/etc/hadoop/

 scp -r hdfs-site.xml node3:/export/server/hadoop-3.3.2/etc/hadoop/

3.2 HUE方面

修改hue.ini

#hue.ini修改路径
cd /export/server/hue-3.9.0-cdh5.14.0/desktop/conf/

#推荐notepad++,原生vi亦可
vim hue.ini

搜索hdfs_clusters

修改成为以下内容

[hadoop]

  # Configuration for HDFS NameNode
  # ------------------------------------------------------------------------
  [[hdfs_clusters]]
    # HA support by using HttpFs

    [[[default]]]
      # Enter the filesystem uri
      fs_defaultfs=hdfs://node1:9000

      webhdfs_url=http://node1:9870/webhdfs/v1

      # Directory of the Hadoop configuration
      # hadoop_conf_dir=$HADOOP_CONF_DIR when set or '/etc/hadoop/conf'
	  hadoop_hdfs_home= /export/server/hadoop-3.3.2
      hadoop_bin=/export/server/hadoop-3.3.2/bin
      hadoop_conf_dir=/export/server/hadoop-3.3.2/etc/hadoop

  # Configuration for YARN (MR2)
  # ------------------------------------------------------------------------

 重要提示:注意两个端口号9000和9870

关于9000:在前面Hadoop安装中core-site.xml中,之前设置为8020,现改为9000,即一致即可

 关于9870:hdfs 2.x   默认50070。hdfs  3.X   默认9870,查看网站是用哪个端口号,即写哪个

 

 HDFS集成完毕

3.3 重启HDFS、HUE

#启动hdfs
start-dfs.sh

#启动HUE
cd /export/server/hue-3.9.0-cdh5.14.0/
build/env/bin/supervisor

4. YARN集成

4.1 YARN方面

#yarn-site.xml路径
cd /export/server/hadoop-3.3.2/etc/hadoop/

#这是系统编辑器,我更习惯notepad++编辑
vim yarn-site.xml

 增加以下内容(根据本人专栏下Hadoop文章安装的话,此处已经配置,查看一下即可)

<property>  ##是否启用日志聚集功能。
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>

<property>  ##设置日志保留时间,单位是秒。
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>
 #将node1配置好的yarn-site.xml复制给node2\node3(之前Hadoop安装已有可不做)
 scp -r yarn-site.xml node2:/export/server/hadoop-3.3.2/etc/hadoop/

 scp -r yarn-site.xml node3:/export/server/hadoop-3.3.2/etc/hadoop/

4.2 HUE方面

修改hue.ini

#hue.ini修改路径
cd /export/server/hue-3.9.0-cdh5.14.0/desktop/conf/

#推荐notepad++,原生vi亦可
vim hue.ini

搜索yarn_clusters

修改成为以下内容

[[yarn_clusters]]

    [[[default]]]
      # Enter the host on which you are running the ResourceManager
      resourcemanager_host=node1

      # The port where the ResourceManager IPC listens on
      resourcemanager_port=8032

      # Whether to submit jobs to this cluster
      submit_to=True

      # URL of the ResourceManager API
      resourcemanager_api_url=http://node1:8088

      # URL of the HistoryServer API
      history_server_api_url=http://node1:19888

 4.3  重启yarn 、hue

start-yarn.sh

build/env/bin/supervisor

相关文章:

  • AtCoder Beginner Contest 267 (A~D)
  • 羊了个羊游戏源码搭建开发过程
  • 基于人工蜂群算法的新型概率密度模型无人机路径规划(Matlab代码实现)
  • File Inclusion 全级别
  • 微信小程序——云开发|计费方式调整大家怎么看?
  • Github 最新霸榜,号称架构师修炼之路的“葵花宝典”限时开源
  • RFSoC应用笔记 - RF数据转换器 -07- RFSoC关键配置之RF-DAC内部解析(一)
  • 【老生谈算法】matlab实现霍夫变换算法源码——霍夫变换算法
  • 赶紧进来看看!!!你一定要会做的八道经典指针笔试题!!!
  • 力扣刷题流程--记录用
  • bp神经网络优化算法对比,bp神经网络的优化算法
  • 新学期,新FLAG | 从心出发
  • 数学建模国赛B题 完整思路与代码分享 无人机遂行编队飞行中的纯方位无源定位
  • 基于C语言实现了PASCAL编译器
  • 2022高教社杯数学建模国赛C题思路代码实现
  • [PHP内核探索]PHP中的哈希表
  • JavaScript-如何实现克隆(clone)函数
  • 《Javascript数据结构和算法》笔记-「字典和散列表」
  • 【MySQL经典案例分析】 Waiting for table metadata lock
  • IDEA常用插件整理
  • isset在php5.6-和php7.0+的一些差异
  • JAVA_NIO系列——Channel和Buffer详解
  • OSS Web直传 (文件图片)
  • vuex 学习笔记 01
  • vue的全局变量和全局拦截请求器
  • 半理解系列--Promise的进化史
  • 二维平面内的碰撞检测【一】
  • 分类模型——Logistics Regression
  • 工作踩坑系列——https访问遇到“已阻止载入混合活动内容”
  • 紧急通知:《观止-微软》请在经管柜购买!
  • 浅谈JavaScript的面向对象和它的封装、继承、多态
  • 小程序01:wepy框架整合iview webapp UI
  • 用jquery写贪吃蛇
  • AI又要和人类“对打”,Deepmind宣布《星战Ⅱ》即将开始 ...
  • Redis4.x新特性 -- 萌萌的MEMORY DOCTOR
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • #162 (Div. 2)
  • #大学#套接字
  • $GOPATH/go.mod exists but should not goland
  • $L^p$ 调和函数恒为零
  • (2)(2.10) LTM telemetry
  • (70min)字节暑假实习二面(已挂)
  • (ros//EnvironmentVariables)ros环境变量
  • (分享)自己整理的一些简单awk实用语句
  • (附源码)ssm基于jsp高校选课系统 毕业设计 291627
  • (免费领源码)Java#Springboot#mysql农产品销售管理系统47627-计算机毕业设计项目选题推荐
  • (十五)使用Nexus创建Maven私服
  • (原創) 如何讓IE7按第二次Ctrl + Tab時,回到原來的索引標籤? (Web) (IE) (OS) (Windows)...
  • * 论文笔记 【Wide Deep Learning for Recommender Systems】
  • *ST京蓝入股力合节能 着力绿色智慧城市服务
  • .htaccess配置重写url引擎
  • .NET delegate 委托 、 Event 事件,接口回调
  • .NET Framework杂记
  • .NET MVC、 WebAPI、 WebService【ws】、NVVM、WCF、Remoting
  • .NET WebClient 类下载部分文件会错误?可能是解压缩的锅