当前位置: 首页 > news >正文

Hadoop架构、Hive相关知识点及Hive执行流程

Hadoop架构

Hadoop由三大部分组成:HDFS、MapReduce、yarn

HDFS:负责数据的存储

其中包括:

        namenode:主节点,用来分配任务给从节点

        secondarynamenode:副节点,辅助主节点

        datanode:从节点,负责实际的存储

MapReduce:负责计算

其中Map负责分解,reduce负责合并

yarn:负责资源调度

其中包括:

        resourcemanager:负责接收用户的请求,并负责集群的管理和资源调度

        nodemanager:负责执行resourcemanager分配的任务


Hive相关知识点

元数据:用来描述数据的数据。

元数据包含:用Hive创建的database、table、表的字段等元信息。

元数据存储:存在关系型数据库中,如:hive内置的Derby数据库或者第三方MySQL数据库等,一般使用Mysql数据库。

Metastore:即元数据存储服务

作用是: 客户端连接metastore服务,metastore再去连接MySQL等数据库来存取元数据。

特点: 有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL等数据库的用户名和密码,只需要连接metastore 服务即可。


Hive执行流程

 1.用户在用户端编写sql语句,通过hive thrift server传到hive

hive中:

2.解析器:解析sql语法

3.编译器:将sql语句编译成MapReduce程序,通过metastore在数据库中获取元数据并映射成一张表

优化器:优化MapReduce程序

4.执行器:将优化后的执MapReduce程序传给Hadoop

Hadoop来执行MapReduce程序,yarn复制资源调度,MapReduce负责计算

5.hive来监督执行情况,Hadoop会将结果存在hdfs中

6.结果返回显示

相关文章:

  • 个人app编程的好处及条件
  • CSS知识点梳理(一)
  • element ui中Select 选择器,自定义显示内容
  • Word2Vec的缺点
  • 将 ONLYOFFICE 文档编辑器与 С# 群件平台集成
  • Python开源项目RestoreFormer(++)——人脸重建(Face Restoration),模糊清晰、划痕修复及黑白上色的实践
  • Debian 9 Stretch APT问题
  • 接口测试及常用接口测试工具
  • 前端小技巧: 数组reduce方法的五种常见用途
  • 矢量图形编辑软件Boxy SVG mac中文版软件特点
  • Python制作国旗头像
  • 深度学习之pytorch第一课
  • 烟草5G智慧工厂数字孪生可视化平台,赋能烟草工业数字化智慧转型
  • 30基于Feign远程调用
  • golang工程组件——redigo使用(redis协议,基本命令,管道,事务,发布订阅,stream)
  • [译]前端离线指南(上)
  • 【162天】黑马程序员27天视频学习笔记【Day02-上】
  • 【347天】每日项目总结系列085(2018.01.18)
  • ERLANG 网工修炼笔记 ---- UDP
  • ESLint简单操作
  • orm2 中文文档 3.1 模型属性
  • PAT A1050
  • v-if和v-for连用出现的问题
  • 简析gRPC client 连接管理
  • 开放才能进步!Angular和Wijmo一起走过的日子
  • 猫头鹰的深夜翻译:JDK9 NotNullOrElse方法
  • 前端面试总结(at, md)
  • 如何学习JavaEE,项目又该如何做?
  • 删除表内多余的重复数据
  • 设计模式走一遍---观察者模式
  • 腾讯优测优分享 | Android碎片化问题小结——关于闪光灯的那些事儿
  • 通过几道题目学习二叉搜索树
  • Spring第一个helloWorld
  • ​软考-高级-信息系统项目管理师教程 第四版【第19章-配置与变更管理-思维导图】​
  • ### Cause: com.mysql.jdbc.exceptions.jdbc4.MySQLTr
  • #Linux(make工具和makefile文件以及makefile语法)
  • #ubuntu# #git# repository git config --global --add safe.directory
  • #我与Java虚拟机的故事#连载02:“小蓝”陪伴的日日夜夜
  • #中的引用型是什么意识_Java中四种引用有什么区别以及应用场景
  • (iPhone/iPad开发)在UIWebView中自定义菜单栏
  • (翻译)Entity Framework技巧系列之七 - Tip 26 – 28
  • (转) SpringBoot:使用spring-boot-devtools进行热部署以及不生效的问题解决
  • .net 7 上传文件踩坑
  • .net 流——流的类型体系简单介绍
  • .NET 中让 Task 支持带超时的异步等待
  • .net使用excel的cells对象没有value方法——学习.net的Excel工作表问题
  • @Async注解的坑,小心
  • @for /l %i in (1,1,10) do md %i 批处理自动建立目录
  • [2019/05/17]解决springboot测试List接口时JSON传参异常
  • [AR Foundation] 人脸检测的流程
  • [AR]Vumark(下一代条形码)
  • [BJDCTF 2020]easy_md5
  • [BZOJ 4034][HAOI2015]T2 [树链剖分]
  • [CareerCup] 14.5 Object Reflection 对象反射
  • [cogs2652]秘术「天文密葬法」