当前位置: 首页 > news >正文

hadoop第一课

Hadoop基本概念
  • 在当下的IT领域,大数据很“热”,实现大数据场 景的Hadoop系列产品更“热”。
  • Hadoop是一个开源的分布式系统基础架构,由 Apache基金会开发。
  • 此架构可以帮助用户可以在不了解分布式底层细 节的情况下,开发分布式程序。
  • 目前,主要的发展版本有Hadoop1.0和Hadoop2.0 。
  • 名字来源于创始人——Doug Cutting儿子的一个黄 色的玩具大象
  • 雏形:Doug Cutting用java代码编写,实现与 Google类似的全文搜索功能,它提供了全文检索 引擎的架构,包括完整的查询引擎和索引引擎。
  • 2001年年底成为apache软件基金会jakarta的一个 子项目。
  • Hadoop起源于Google的集群系统
  • Google的三大核心的分布式技术
            – 2003年,GFS分布式存储系统
            – 2004年,MapReduce分布式处理技术
            – 2006年,BigTable分布式数据库
  • 对于大数据量的场景,迫使Doug Cutting学习 和模仿Google解决这些问题。
目前最新应用领域
农业 • 地震台网监测 • 医疗 • 可穿戴设备 • 无人驾驶汽车
讨论课题
任何事物都具有两面性,请分组讨论:在你的眼中“大数据”处理技术给人类带来了哪些好处? 哪些问题?
课程安排
课程安排分为理论课(32学时)和实验课(16学时)
  • 理论课 
  – Hadoop概述
  – YARN设计理念与基础架构
   – MapReduce编程模型
   – HDFS详解
  • 实验课
   – Hadoop2.0的环境搭建
   – MapReduce开发环境搭建
   – 调试运行编写MapReduce词频统计程序
  – MapReduce程序编程
课程目标
• 了解YARN的基本工作原理
• 了解Hadoop2.0的两大核心模块的工作原理
• 熟悉Hadoop2.0环境搭建、配置与管理
• 熟练向Hadoop提交作业以及查询作业运行情况
• 能书写Map-Reduce程序 • 能熟练地对HDFS中的文件进行管理
参考文献
• Hadoop实战
• Hadoop权威指南
• Welcome to Apache™ Hadoop®!
• http://www.slideshare.net/
 
 
课堂笔记
(1)理解 集群 分布式 数据中心的概念 以及其中的关系?
答:集群大抵是指硬件,分布式大抵是指软件,集群加上分布式的商业化体现就是数据中心。
(2)理解可迁移技术与负载均衡的概念。
答:举个例子,一个游戏,有三个区,每个区各有三台服务器。我们都知道晚饭过后,登录游戏的人很多,倘若一区爆满,二区三区人相对比较少,此时可迁移技术就派上了用场,把二三区空闲的服务器迁移到一区或者将另外备用的服务器给一区,进而负载均衡。同样的道理,在游戏中,过不了的动画,副本排队,卡下线,都和可迁移技术和负载均衡有关。再举个例子,深夜的时候,打游戏的人相对会少很多,这时,运营商可能就会关掉二区三区的服务器,只留下一区的服务器,以此来减少成本。
(3)理解互联网 云计算 大数据 人工智能的概念 以及彼此之间的关系?
答:略。
————————————————————————————————
 

转载于:https://www.cnblogs.com/DC0307/p/8569591.html

相关文章:

  • 【PTA 天梯赛训练】电话聊天狂人(简单map)
  • 数组元素为对象,对比多个数组的相同子元素并筛选
  • SpringCloud之Hystrix断路器[六]
  • 八皇后(递归+深度优先搜索)
  • Carousel 走马灯
  • 优先队列的基本用法(java和c++)
  • 程序题
  • 在 GitLab 我们是如何扩展数据库的
  • 复变用于图片映射
  • 浅谈@RestController和@Controller的区别
  • KMP算法之我见
  • Java 内省(Introspector)深入理解
  • Hibernate如何支持事务
  • PS
  • Pycharm增加新安装Python的路径
  • android 一些 utils
  • Java多态
  • js ES6 求数组的交集,并集,还有差集
  • JSONP原理
  • js中forEach回调同异步问题
  • leetcode378. Kth Smallest Element in a Sorted Matrix
  • Python十分钟制作属于你自己的个性logo
  • React16时代,该用什么姿势写 React ?
  • Tornado学习笔记(1)
  • Webpack 4x 之路 ( 四 )
  • 阿里云前端周刊 - 第 26 期
  • 从零搭建Koa2 Server
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 诡异!React stopPropagation失灵
  • ------- 计算机网络基础
  • 漫谈开发设计中的一些“原则”及“设计哲学”
  • ​软考-高级-系统架构设计师教程(清华第2版)【第12章 信息系统架构设计理论与实践(P420~465)-思维导图】​
  • ​无人机石油管道巡检方案新亮点:灵活准确又高效
  • #### go map 底层结构 ####
  • #[Composer学习笔记]Part1:安装composer并通过composer创建一个项目
  • $ git push -u origin master 推送到远程库出错
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第2节(共同的基类)
  • (Ruby)Ubuntu12.04安装Rails环境
  • (SpringBoot)第二章:Spring创建和使用
  • (论文阅读32/100)Flowing convnets for human pose estimation in videos
  • (图)IntelliTrace Tools 跟踪云端程序
  • (一)使用Mybatis实现在student数据库中插入一个学生信息
  • (一一四)第九章编程练习
  • .NET HttpWebRequest、WebClient、HttpClient
  • .Net Remoting(分离服务程序实现) - Part.3
  • .NET/C# 的字符串暂存池
  • .netcore如何运行环境安装到Linux服务器
  • .php结尾的域名,【php】php正则截取url中域名后的内容
  • ::前边啥也没有
  • @Repository 注解
  • @软考考生,这份软考高分攻略你须知道
  • []常用AT命令解释()
  • [22]. 括号生成
  • [android] 看博客学习hashCode()和equals()
  • [Asp.net MVC]Asp.net MVC5系列——Razor语法