当前位置: 首页 > news >正文

hadoop理论基础(一)

1.hadoop的组成

2 HDFS概述

HDFS(Hadoop Distributed File System)是一个分布式文件系统

(1)NameNode:存储文件的元数据;如文件名、文件目录结构、文件属性,以及每个文件的块列表和块所在的DataNode等。

(2)DataNode:在本地文件系统存储文件块数据

(3)每隔一段时间对NameNode元数据备份。

3Yarn概述

YARN(Yet Another Resource Negotiater):另一种资源协调者,是Hadoop的资源管理器。

ResourceManager(RM):整个集群资源(内存、CPU等)的管理者

NodeManager(NM):单个节点服务器资源管理者

ApplicationMaster(AM):单个任务运行的管理者

Container:容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源,如内存、CPU、磁盘、网络等

4 MapReduce概述

负责海量数据的计算

MapReduce将计算拆成两个阶段:Map和Reduce

  • Map阶段并行处理输入数据

  • Reduce阶段对Map结果进行汇总

5 HDFS、YARN、MapReduce三者关系

6 大数据技术的生态体系

相关文章:

  • FPGA之时钟规划图解
  • python 绘图时出现报错:A colormap named “BlueWhiteOrangeRed“ is already registered.
  • 安卓手机也可以使用新必应NewBing
  • C++并发编程之三 并发操作的同步
  • 不好!有敌情,遭到XSS攻击【网络安全篇】
  • yolov5 剪枝、蒸馏、压缩、量化
  • 断崖式难度的春招,可以get这些点
  • MySQL数据库的基础语法总结(1)
  • leetcode 15. 三数之和
  • SSL、TLS应用笔记
  • 学生信息表
  • 三天吃透计算机网络面试八股文
  • 【事务与锁】当Transactional遇上synchronized
  • 为什么 Python 没有 main 函数?
  • IP协议+以太网协议
  • 【跃迁之路】【477天】刻意练习系列236(2018.05.28)
  • Git同步原始仓库到Fork仓库中
  • gulp 教程
  • js 实现textarea输入字数提示
  • Objective-C 中关联引用的概念
  • Quartz初级教程
  • Spring Cloud中负载均衡器概览
  • SQLServer插入数据
  • Vultr 教程目录
  • 案例分享〡三拾众筹持续交付开发流程支撑创新业务
  • 读懂package.json -- 依赖管理
  • 复杂数据处理
  • 给初学者:JavaScript 中数组操作注意点
  • 机器学习 vs. 深度学习
  • 聊聊sentinel的DegradeSlot
  • 如何用vue打造一个移动端音乐播放器
  • 线性表及其算法(java实现)
  • 项目管理碎碎念系列之一:干系人管理
  • 一个普通的 5 年iOS开发者的自我总结,以及5年开发经历和感想!
  • 再谈express与koa的对比
  • 职业生涯 一个六年开发经验的女程序员的心声。
  • 完善智慧办公建设,小熊U租获京东数千万元A+轮融资 ...
  • #define与typedef区别
  • #每日一题合集#牛客JZ23-JZ33
  • #周末课堂# 【Linux + JVM + Mysql高级性能优化班】(火热报名中~~~)
  • (Redis使用系列) Springboot 使用Redis+Session实现Session共享 ,简单的单点登录 五
  • (定时器/计数器)中断系统(详解与使用)
  • (六)软件测试分工
  • (转)Linq学习笔记
  • (转)mysql使用Navicat 导出和导入数据库
  • .Net - 类的介绍
  • .NET 2.0中新增的一些TryGet,TryParse等方法
  • .NET 同步与异步 之 原子操作和自旋锁(Interlocked、SpinLock)(九)
  • .net(C#)中String.Format如何使用
  • .NET6使用MiniExcel根据数据源横向导出头部标题及数据
  • .NET开源快速、强大、免费的电子表格组件
  • /etc/fstab和/etc/mtab的区别
  • /var/log/cvslog 太大
  • ??如何把JavaScript脚本中的参数传到java代码段中
  • @html.ActionLink的几种参数格式