当前位置: 首页 > news >正文

6.hadoop文件数据库系列讲解

学习总结

hadoop由两大块组成:hadoop自身+hadoop生态
hadoop管理的是文件,也就是相当于一个windows的文件资源管理器,文件可以是任意文件格式
在这里插入图片描述

hadoop的核心组件

hadoop的核心组件有hdfs,yarn,mapreduce

  • hdfs是由两部分构成NameNode:节点目录DataNode:数据保存节点,NameNode数量可以少于DataNode
  • yarn是资源管理模块由两部分构成RouceManger:总的资源管理器,NodeManager:接收总的资源管理器调度的子资源管理器
  • mapredue是一个离线计算工具,用来指挥yarn做计算调度的
    在这里插入图片描述

hadoop生态

  • 数据存储扩展:hbase,kafa,flume
  • 数据计算查询:hive,spark
  • 任务调度:Ozie

hadoop版本

一、Hadoop 版本主要有四个,分别是:

  • Apache(最原始的版本,所有发行版均基于这个版本进行改进)
  • Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)
  • Hortonworks版本(Hortonworks Data Platform,简称HDP)
  • CDP(CDH和HDP合并后的产品,是付费的没有免费版)

对于国内而言,绝大多数选择 CDH 版本,集成部署更加方便和易于管理

相关文章:

  • Day11OSI与TCP/IP协议簇以及物理层
  • Javaweb学生信息管理系统(Mysql+JSP+MVC+CSS)
  • ubuntu-hadoop伪分布
  • springboot 多环境配置(pom配置Profiles变量来,控制打包环境)
  • 计算机毕业设计ssm蓟县农家院网站2zl2w系统+程序+源码+lw+远程部署
  • 刷题记录(NC16645 [NOIP2007]矩阵取数游戏,NC207781 迁徙过程中的河流,NC235953 最大m个子段和)
  • 【网络服务数据库教程】05 LAMP 部署
  • QScintilla学习大全
  • 【计算机网络】第三章:数据链路层
  • 复习C部分:1.看代码求值题 2.写三个整数代码从大到小输出 3.打印1~100中所有3的倍数 4.给定两个数,求最大公约数(递减法,辗转相除法)
  • 网络安全笔记-Web架构
  • 二叉树实现(创建,遍历)
  • Pandas的DataFrame Series【详解】
  • 使用vscode下载插件在线打开html界面,解决没有Open in default brower选择问题
  • 【网络服务数据库教程】07 ELK日志解决方案
  • 《Javascript数据结构和算法》笔记-「字典和散列表」
  • 【干货分享】SpringCloud微服务架构分布式组件如何共享session对象
  • 0基础学习移动端适配
  • Bytom交易说明(账户管理模式)
  • docker-consul
  • es6(二):字符串的扩展
  • python 学习笔记 - Queue Pipes,进程间通讯
  • REST架构的思考
  • scrapy学习之路4(itemloder的使用)
  • STAR法则
  • 从零开始的webpack生活-0x009:FilesLoader装载文件
  • 机器学习中为什么要做归一化normalization
  • 使用 @font-face
  • 移动端 h5开发相关内容总结(三)
  • MyCAT水平分库
  • 好程序员大数据教程Hadoop全分布安装(非HA)
  • 回归生活:清理微信公众号
  • # Swust 12th acm 邀请赛# [ E ] 01 String [题解]
  • ###C语言程序设计-----C语言学习(6)#
  • #Linux(make工具和makefile文件以及makefile语法)
  • #中国IT界的第一本漂流日记 传递IT正能量# 【分享得“IT漂友”勋章】
  • (06)Hive——正则表达式
  • (11)MSP430F5529 定时器B
  • (14)Hive调优——合并小文件
  • (day 12)JavaScript学习笔记(数组3)
  • (NSDate) 时间 (time )比较
  • (附源码)springboot电竞专题网站 毕业设计 641314
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (十六)串口UART
  • (四)【Jmeter】 JMeter的界面布局与组件概述
  • (一)python发送HTTP 请求的两种方式(get和post )
  • .NET MVC第五章、模型绑定获取表单数据
  • .NET 将混合了多个不同平台(Windows Mac Linux)的文件 目录的路径格式化成同一个平台下的路径
  • .net程序集学习心得
  • .sdf和.msp文件读取
  • 。Net下Windows服务程序开发疑惑
  • @Autowired @Resource @Qualifier的区别
  • @data注解_一枚 架构师 也不会用的Lombok注解,相见恨晚
  • @RequestParam,@RequestBody和@PathVariable 区别
  • [ 手记 ] 关于tomcat开机启动设置问题