当前位置: 首页 > news >正文

大数据-基础架构设施演进的过程

一、第一阶段-Hadoop

以Hadoop为代表的离线数据处理基础设施

 

1.1、围绕HDFS和MR,产生了一系列的组件

  • 面向在线KV操作的HBase
  • 面向SQL的Hive
  • 面向工作流的PIG

1.2、随着对批处理性能要求越来越高,产生了Tez、Spark、Flink等计算引擎。RM模型也逐步进化成DAG模型。

DAG模型

1、增加计算模型的抽象和并发能力

根据聚合操作把任务分为多个stage,每个stage由一个或者多个task组成,task可以并行执行,从而提供计算的并行能力

2、减少计算过程中的中间结果IO操作

为了减少处理过程中的中间结果写文件操作,spark、presto等计算引擎尽量使用计算节点的内存对数据进行缓存,从而提高整个计算过程中的数据效率和吞吐能力

二、第二阶段-lambda架构

批处理计算能力提升有限了还是无法满足需求,需要结合离线和实时才能解决问题。催生了,SparkStreaming、Flink的出现。最终“流批一体”出现了。

三、第三阶段-kapa架构

 

流批一体解决了问题,但是架构太复杂了,能不能用一套系统来跑就行了。流失处理天生的并发行和分布式特点,注定有更好的拓展性。通过流式计算提高并发行,加大流式计算的窗口。来统一批流程和流处理两种计算模式 

相关文章:

  • Android学习进阶
  • Mapper.xml映射文件
  • 【笔记】Python学习记录
  • Windows 11 安装 Scoop
  • Mysql数据库:索引管理
  • 【算法与数据结构】二叉树(前中后)序遍历
  • 自营、入驻商城小程序开发
  • Charles 工具如何做断点测试?
  • 流畅的 Python 第二版(GPT 重译)(二)
  • Elastic-Job 分布式任务调度
  • 外包干了14天,技术退步明显。。。
  • 【数据库】SQL Server 2008 R2 安装过程
  • 数据结构之排序一
  • 第六章 Java 正则表达式
  • 34-Java传输对象模式 ( Transfer Object Pattern )
  • CSS3 变换
  • mysql innodb 索引使用指南
  • 聊聊sentinel的DegradeSlot
  • 如何优雅地使用 Sublime Text
  • 数据结构java版之冒泡排序及优化
  • 微信如何实现自动跳转到用其他浏览器打开指定页面下载APP
  • 微信小程序设置上一页数据
  • 译米田引理
  • 用mpvue开发微信小程序
  • 在Unity中实现一个简单的消息管理器
  • [Shell 脚本] 备份网站文件至OSS服务(纯shell脚本无sdk) ...
  • postgresql行列转换函数
  • 阿里云服务器如何修改远程端口?
  • ​LeetCode解法汇总2696. 删除子串后的字符串最小长度
  • #define与typedef区别
  • #LLM入门|Prompt#2.3_对查询任务进行分类|意图分析_Classification
  • #ubuntu# #git# repository git config --global --add safe.directory
  • $.ajax()参数及用法
  • (BFS)hdoj2377-Bus Pass
  • (二)【Jmeter】专栏实战项目靶场drupal部署
  • (太强大了) - Linux 性能监控、测试、优化工具
  • (一)Linux+Windows下安装ffmpeg
  • (转)winform之ListView
  • (转载)CentOS查看系统信息|CentOS查看命令
  • .bat文件调用java类的main方法
  • .NET 4.0中的泛型协变和反变
  • .net core 6 集成 elasticsearch 并 使用分词器
  • @value 静态变量_Python彻底搞懂:变量、对象、赋值、引用、拷贝
  • [2018][note]用于超快偏振开关和动态光束分裂的all-optical有源THz超表——
  • [Avalon] Avalon中的Conditional Formatting.
  • [C#]winform制作仪表盘好用的表盘控件和使用方法
  • [C语言][PTA基础C基础题目集] strtok 函数的理解与应用
  • [Excel] vlookup函数
  • [flask]http请求//获取请求体数据
  • [JS] node.js 入门
  • [Linux]进程信号(信号入门 | 信号产生的方式 | 信号捕捉初识)
  • [LOJ#6259]「CodePlus 2017 12 月赛」白金元首与独舞
  • [Luogu P3527BZOJ 2527][Poi2011]Meteors(整体二分+BIT)
  • [MFC] VS2013版本MFC工程移植到VC6.0上
  • [mmucache]-ARMV8-aarch64的虚拟内存(mmutlbcache)介绍-概念扫盲