当前位置: 首页 > news >正文

实时数仓之实时数仓架构(Doris)

        目前比较流行的实时数仓架构有两类,其中一类是以Flink+Doris为核心的实时数仓架构方案;另一类是以湖仓一体架构为核心的实时数仓架构方案。本文针对Flink+Doris架构进行介绍,这套架构的特点是组件涉及相对较少,架构简单,实时性更高,且易于Lambda架构实现,Doris本身可以支持流批融合(包括离线修复场景)。实时数仓架构图如下:

  • 技术框架

    • Kafka:用于接入数据,缓存存储DWD/DWS/DIM中间结果;

    • Flink:用于数据ETL,包括接入数据、处理数据及输出数据全链路数据计算任务;

    • Doris:OLAP引擎,用来存储经过Flink加工过的事实表和维表数据,同时对外提供数据服务支持;

    • Hbase&Redis:用来存储维表信息,维表数据来源一部分有Flink加工实时写入,另一部分是从离线任务同步数据,其主要作用用来支持Flink ETL处理过程中的Lookup Join功能。这里选用Hbase原因主要因为Table的Hbase Connector支持异步IO功能。

    • StreamX:Flink任务管理工具,用于部署管理以及监控Flink实时任务;

    • HDFS:针对原始日志数据备份,必要时刻可以通过备份数据恢复全链路数据;

    • <

相关文章:

  • Svg Flow Editor 原生svg流程图编辑器(三)
  • Java安全 反序列化(4) CC1链-LazyMap版
  • LLM - 大语言模型的分布式训练 概述
  • 如何关闭路由器的5G Wi-Fi
  • 【呼市经开区建设服务项目水、电能耗监测 数采案例】
  • C语言:自定义类型:结构体
  • Autosar的前世今生:E2E通信校验
  • elementUI(Vue2)和elementPlus(Vue3)图标icon差异
  • VB.NET 中的异常处理机制是什么?请提供简单的异常处理示例
  • OpenLayers基础教程——使用WebGL加载海量数据(1)
  • Docker学习笔记 - 使用配置脚本来启动image
  • golang常用库之-golang常用库之-ladon包 | 基于策略的访问控制
  • docker入门(十)—— docker-compose详解
  • stm32定时器
  • scDEA一键汇总12种单细胞差异分析方法 DESeq2、edgeR、MAST、monocle、scDD、Wilcoxon
  • Angular 2 DI - IoC DI - 1
  • CSS 三角实现
  • CSS 专业技巧
  • gitlab-ci配置详解(一)
  • HashMap剖析之内部结构
  • iOS | NSProxy
  • JavaScript 是如何工作的:WebRTC 和对等网络的机制!
  • Js基础知识(四) - js运行原理与机制
  • k8s如何管理Pod
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • PHP 程序员也能做的 Java 开发 30分钟使用 netty 轻松打造一个高性能 websocket 服务...
  • php中curl和soap方式请求服务超时问题
  • React 快速上手 - 07 前端路由 react-router
  • vue2.0开发聊天程序(四) 完整体验一次Vue开发(下)
  • windows下如何用phpstorm同步测试服务器
  • 闭包--闭包作用之保存(一)
  • 从零开始在ubuntu上搭建node开发环境
  • 高度不固定时垂直居中
  • 前端性能优化--懒加载和预加载
  • 我有几个粽子,和一个故事
  • 一些css基础学习笔记
  • 怎么把视频里的音乐提取出来
  • 3月27日云栖精选夜读 | 从 “城市大脑”实践,瞭望未来城市源起 ...
  • 宾利慕尚创始人典藏版国内首秀,2025年前实现全系车型电动化 | 2019上海车展 ...
  • # 计算机视觉入门
  • # 再次尝试 连接失败_无线WiFi无法连接到网络怎么办【解决方法】
  • #周末课堂# 【Linux + JVM + Mysql高级性能优化班】(火热报名中~~~)
  • $emit传递多个参数_PPC和MIPS指令集下二进制代码中函数参数个数的识别方法
  • (function(){})()的分步解析
  • (Redis使用系列) Springboot 实现Redis消息的订阅与分布 四
  • (读书笔记)Javascript高级程序设计---ECMAScript基础
  • (附源码)springboot建达集团公司平台 毕业设计 141538
  • (附源码)springboot金融新闻信息服务系统 毕业设计651450
  • (免费领源码)python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐
  • (十)【Jmeter】线程(Threads(Users))之jp@gc - Stepping Thread Group (deprecated)
  • (转)setTimeout 和 setInterval 的区别
  • .Net Attribute详解(上)-Attribute本质以及一个简单示例
  • .net core MVC 通过 Filters 过滤器拦截请求及响应内容
  • .net core 实现redis分片_基于 Redis 的分布式任务调度框架 earth-frost
  • .NET 使用 ILRepack 合并多个程序集(替代 ILMerge),避免引入额外的依赖