当前位置: 首页 > news >正文

Hadoop和分布式系统

简介

  • 由Apache开发的分布式系统基础架构;
  • 用户可以在不了解分布式狄岑细节的请款那个下,开发分布式程序,充分利用集群的威力进行高效运算和存储;
  • Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS;
  • HDFS有很高的容错性的特点,并且设计用来部署在低廉的硬件上;而且提供很高的吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序;HDFS方宽看POSIX的要求,可以以流的形式访问文件系统中的数据;
  • Hadoop的框架最核心的设计就是:HDFS和MapReduce;
  • HDFS为海量的数据提供了存储;
  • MapReduce则为海量的数据提供了计算;

 

分布式系统

  • 一个著名的分布式系统的例子就是万维网(World Wide Web)也就是www
    • WWW是环球信息网的缩写,(亦作“Web”、“WWW”、“'W3'”,英文全称为“World Wide Web”),中文名字为“万维网”,"环球网"等,常简称为Web。 分为Web客户端和Web服务器程序。 WWW可以让Web客户端(常用浏览器)访问浏览Web服务器上的页面。 是一个由许多互相链接的超文本组成的系统,通过互联网访问。在这个系统中,每个有用的事物,称为一样“资源”;并且由一个全局“统一资源标识符”(URI)标识;这些资源通过超文本传输协议(Hypertext Transfer Protocol)传送给用户,而后者通过点击链接来获得资源。

 

  • 建立在网络之上的软件系统;正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性;因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件;
  • 分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统;
  • 首先,这种系统最起码都是由好几台主机组成的;
  • 其次,这些主机对外人来说是看不到的;也就是说,我们只看到是一个系统在运作;
  • 从进程的角度看,脸男公关程序分别裕兴在两个主机的进程上,他们相互协作完成同一个服务或者功能,那么理论上这两个程序所组成的系统,也可以称作是“分布式系统”;
  • 当然,这两个程序可以是不同的程序,也可以是相同的程序;如果是相同的程序,我们又可以称之为“集群”;所谓集群,就是将相同的程序,通过不断横向扩展,以提高服务能力的方式;

 

 

分布式系统优势

  • 说起分布式系统,我们就不得不说下分布式系统的祖先——集中式系统。集中式系统跟分布式系统是完全相反的两个概念。集中式系统就是把所有的程序、功能都集中到一台主机上,从而往外提供服务的方式。
  • 我们把各种软件都安装在一台机子上,当我需要什么功能,我就从这台机子上去获取。再比如,我们在学生时代做的课程设计或者开发时的小应用,我们把Web服务器、数据库等都会安装到一台电脑上。好处是,易于理解、方便维护,想要的东西我都放到了一个地方,东西好找啊。
  • 但是如果这台机子崩了,或者硬盘坏了,那相当与整个系统就奔溃了

 

  • 使用分布式系统的另外一个理由是可扩展性。毕竟任何主机(哪怕是小型机、超级计算机)都会有性能的极限。而分布式系统可以通过不断扩张主机的数量以实现横向水平性能的扩展。

 

 

相关文章:

  • c++ 指向类成员函数的函数指针
  • 数组流中的中位数
  • Java——观察者模式实例
  • 连续子数组的最大和
  • 礼物的最大价值
  • 最长不含重复字符的字符串
  • Mac下JDK的安装的配置
  • 第二阶段个人总结09
  • java并发
  • idea中Spring报错Exception in thread main java.lang.ClassCastException
  • How Spring Boot Autoconfiguration Magic Works--转
  • PriorityQueue优先级队列
  • TCP/IP三次握手与四次挥手
  • MySQL的多实例
  • MyBatis
  • [LeetCode] Wiggle Sort
  • 《Java编程思想》读书笔记-对象导论
  • 【391天】每日项目总结系列128(2018.03.03)
  • 【407天】跃迁之路——程序员高效学习方法论探索系列(实验阶段164-2018.03.19)...
  • 【刷算法】求1+2+3+...+n
  • 30天自制操作系统-2
  • 闭包--闭包之tab栏切换(四)
  • 精益 React 学习指南 (Lean React)- 1.5 React 与 DOM
  • 设计模式 开闭原则
  • 树莓派 - 使用须知
  • 腾讯优测优分享 | 你是否体验过Android手机插入耳机后仍外放的尴尬?
  • 写代码的正确姿势
  • 一份游戏开发学习路线
  • 一些关于Rust在2019年的思考
  • shell使用lftp连接ftp和sftp,并可以指定私钥
  • #!/usr/bin/python与#!/usr/bin/env python的区别
  • #我与Java虚拟机的故事#连载10: 如何在阿里、腾讯、百度、及字节跳动等公司面试中脱颖而出...
  • (20)目标检测算法之YOLOv5计算预选框、详解anchor计算
  • (C++17) optional的使用
  • (C++17) std算法之执行策略 execution
  • (非本人原创)我们工作到底是为了什么?​——HP大中华区总裁孙振耀退休感言(r4笔记第60天)...
  • (附源码)php投票系统 毕业设计 121500
  • (附源码)springboot人体健康检测微信小程序 毕业设计 012142
  • (论文阅读11/100)Fast R-CNN
  • (三)Hyperledger Fabric 1.1安装部署-chaincode测试
  • (三分钟了解debug)SLAM研究方向-Debug总结
  • (学习日记)2024.01.19
  • (转)memcache、redis缓存
  • ***汇编语言 实验16 编写包含多个功能子程序的中断例程
  • . NET自动找可写目录
  • .NET Framework与.NET Framework SDK有什么不同?
  • .NET 使用 ILRepack 合并多个程序集(替代 ILMerge),避免引入额外的依赖
  • .NET 线程 Thread 进程 Process、线程池 pool、Invoke、begininvoke、异步回调
  • .NET牛人应该知道些什么(2):中级.NET开发人员
  • .NET企业级应用架构设计系列之技术选型
  • .NET企业级应用架构设计系列之结尾篇
  • @requestBody写与不写的情况
  • [ 隧道技术 ] 反弹shell的集中常见方式(二)bash反弹shell
  • [2008][note]腔内级联拉曼发射的,二极管泵浦多频调Q laser——
  • [2019.3.5]BZOJ1934 [Shoi2007]Vote 善意的投票