当前位置：首页 > news >正文

Apache Hadoop的核心组成及其架构

news 来源：原创 2024/9/30 7:26:54

核心组成

Apache Hadoop 是一个开源的分布式存储与计算框架，它主要由以下几个核心组件组成：

Hadoop Distributed File System (HDFS): HDFS 是 Hadoop 的分布式文件系统，它设计用于存储大量数据，并提供高吞吐率的数据访问，通过将数据分块存储在多个节点上，实现数据的冗余存储和容错。
Hadoop YARN (Yet Another Resource Negotiator): YARN 是 Hadoop 的资源管理层，负责管理计算资源（如 CPU 和内存），并为运行在 Hadoop 集群上的应用程序分配资源。YARN 引入了资源调度和作业管理的概念，使得 Hadoop 能够运行多种数据处理框架。
Hadoop MapReduce: MapReduce 是 Hadoop 的编程模型，用于并行处理大规模数据集。MapReduce 工作流程分为两个阶段：Map 阶段和 Reduce 阶段，通过 Map 函数处理输入数据，然后通过 Reduce 函数聚合处理结果。

Hadoop=HDFS(分布式文件系统)+MapReduce(分布式计算框架)+Yarn(资源协调框架)+Common模块

除了这三个核心组件，Hadoop 生态系统还包含许多其他的项目和工具，如：

Hadoop Common：提供了 Hadoop 运行所需的公共库和工具。
Hive：一个建立在 Hadoop 之上的数据仓库基础设施，提供 SQL 查询语言 SQL（HiveQL）

相关文章：

气膜建筑在体育和娱乐行业的多样化应用—轻空间

小程序视图渲染数据和部分事件的绑定

讲透计算机网络知识(实战篇)01——计算机网络和协议

企业级开源项目，云缓存解决方案：CacheCloud

苹果WWDC24一文总结，携手OpenAi，开启Ai新篇章

操作系统复习-Linux的文件系统

第8章函数

C++的STL 中 set.map multiset.multimap 学习使用详细讲解（含配套OJ题练习使用详细解答）

细说ARM MCU的串口接收数据的实现过程

3D感知视觉表示与模型分析：深入探究视觉基础模型的三维意识

【介绍下Pandas，什么是Pandas？】

VitePress做一个自己的知识博客

OpenGauss常操作

通过 urllib 结合代理IP下载文件实现Python爬虫

数组循环form表单对象校验

2017 前端面试准备 - 收藏集 - 掘金

4个实用的微服务测试策略

express.js的介绍及使用

GDB 调试 Mysql 实战（三）优先队列排序算法中的行记录长度统计是怎么来的（上）...

github指令

interface和setter，getter

Java编程基础24——递归练习

JS+CSS实现数字滚动

Leetcode 27 Remove Element

markdown编辑器简评

php中curl和soap方式请求服务超时问题

Sass Day-01

产品三维模型在线预览

彻底搞懂浏览器Event-loop

从零到一：用Phaser.js写意地开发小游戏（Chapter 3 - 加载游戏资源）

从零开始的无人驾驶 1

基于 Ueditor 的现代化编辑器 Neditor 1.5.4 发布

今年的LC3大会没了？

名企6年Java程序员的工作总结，写给在迷茫中的你！

如何邀请好友注册您的网站(模拟百度网盘)

项目实战-Api的解决方案

小李飞刀：SQL题目刷起来！

掌握面试——弹出框的实现（一道题中包含布局/js设计模式）

走向全栈之MongoDB的使用

Java性能优化之JVM GC（垃圾回收机制）

linux 淘宝开源监控工具tsar

Python 之网络式编程

阿里云重庆大学大数据训练营落地分享

宾利慕尚创始人典藏版国内首秀，2025年前实现全系车型电动化 | 2019上海车展 ...

Benvista PhotoZoom Pro 9.0.4新功能介绍

LeetCode解法汇总1276. 不浪费原料的汉堡制作方案

软考-高级-系统架构设计师教程（清华第2版）【第12章信息系统架构设计理论与实践（P420~465）-思维导图】

软考-高级-系统架构设计师教程（清华第2版）【第20章系统架构设计师论文写作要点（P717~728）-思维导图】

#LLM入门|Prompt#2.3_对查询任务进行分类|意图分析_Classification

#pragma pack(1)

（06）金属布线——为半导体注入生命的连接

（52）只出现一次的数字III

（Java企业 / 公司项目）点赞业务系统设计-批量查询点赞状态（二）

(Matlab)遗传算法优化的BP神经网络实现回归预测

(webRTC、RecordRTC):navigator.mediaDevices undefined