当前位置: 首页 > news >正文

大数据教程(8.1)mapreduce核心思想

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

        上一章介绍了hadoop的HDFS文件系统的原理及API使用。本章博主将继续对hadoop的mapreduce编程框架进行分享。

        mapreduce原理篇

        mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架;mapreduce的核心功能是将用户编写的业务逻辑代码和自带的默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上;

        为什么要mapreduce:

        (1).海量数据在单机上处理因为硬件资源限制,无法胜任

        (2).而一旦将单机版程序扩展到集群来分布式运行,将极大增加程序的复杂度和开发难度

        (3).引入mapreduce框架后,开发人员可以将绝大部分工作集中在业务逻辑的开发上,而将分布式计算中的复杂性交由框架来处理

       mapreduce的整体结构包含:一个完整的mapreduce程序在分布式运行时有三类实例进程;

        1.MRAppMaster(mapreduce application master):负责整个程序的过程调度及状态协调
        2.MapTask:负责map阶段的整个数据处理流程
        3.ReduceTask:负责reduce阶段的整个数据处理流程

        mapredcue核心框架设计思想:

edce2cbd1d93bc224530033a9a224f4e0e8.jpg

        最后寄语,以上是博主本次文章的全部内容,如果大家觉得博主的文章还不错,请点赞;如果您对博主其它服务器大数据技术或者博主本人感兴趣,请关注博主博客,并且欢迎随时跟博主沟通交流。

       

转载于:https://my.oschina.net/u/2371923/blog/2878034

相关文章:

  • 面向对象(1)
  • 阿里云视频直播API签名机制源码
  • 奇怪的事
  • java中使用lambda简化代码
  • 设计要做到扩展性强还挺难的
  • 云宏与英特尔携手发布了可全面兼容主流虚拟化解决方案
  • 收集 Kubernetes 资源统计数据的新工具
  • 从零开始搭建物联网平台(7):使用Vue编写前端页面
  • Java 面向对象之构造方法
  • 我与Jetbrains的这些年
  • input实现文字超出省略号功能
  • 复习Javascript专题(四):js中的深浅拷贝
  • stackoverflow:为什么排序后的数组要比未排序数组运行快3倍以上?
  • 胡小林:把日常生活中碰到的事变成我们发露忏悔的机会
  • 分布式消息队列 Kafka
  • 时间复杂度分析经典问题——最大子序列和
  • 《Java编程思想》读书笔记-对象导论
  • CNN 在图像分割中的简史:从 R-CNN 到 Mask R-CNN
  • css属性的继承、初识值、计算值、当前值、应用值
  • Druid 在有赞的实践
  • ES6 学习笔记(一)let,const和解构赋值
  • JAVA之继承和多态
  • JDK9: 集成 Jshell 和 Maven 项目.
  • Vue 动态创建 component
  • 从setTimeout-setInterval看JS线程
  • 等保2.0 | 几维安全发布等保检测、等保加固专版 加速企业等保合规
  • 基于组件的设计工作流与界面抽象
  • 理解在java “”i=i++;”所发生的事情
  • 前端知识点整理(待续)
  • 实现简单的正则表达式引擎
  • 提升用户体验的利器——使用Vue-Occupy实现占位效果
  • 移动互联网+智能运营体系搭建=你家有金矿啊!
  • 优秀架构师必须掌握的架构思维
  • 在electron中实现跨域请求,无需更改服务器端设置
  • 终端用户监控:真实用户监控还是模拟监控?
  • 【运维趟坑回忆录 开篇】初入初创, 一脸懵
  • LevelDB 入门 —— 全面了解 LevelDB 的功能特性
  • Redis4.x新特性 -- 萌萌的MEMORY DOCTOR
  • 阿里云重庆大学大数据训练营落地分享
  • 好程序员大数据教程Hadoop全分布安装(非HA)
  • # 数据结构
  • ###C语言程序设计-----C语言学习(3)#
  • (二)正点原子I.MX6ULL u-boot移植
  • (淘宝无限适配)手机端rem布局详解(转载非原创)
  • (原+转)Ubuntu16.04软件中心闪退及wifi消失
  • ***检测工具之RKHunter AIDE
  • .NET 6 在已知拓扑路径的情况下使用 Dijkstra,A*算法搜索最短路径
  • .NET I/O 学习笔记:对文件和目录进行解压缩操作
  • .NET大文件上传知识整理
  • .NET开源全面方便的第三方登录组件集合 - MrHuo.OAuth
  • .net连接oracle数据库
  • [ vulhub漏洞复现篇 ] JBOSS AS 5.x/6.x反序列化远程代码执行漏洞CVE-2017-12149
  • [2023年]-hadoop面试真题(一)
  • [Bugku]密码???[writeup]
  • [bzoj2957]楼房重建