当前位置: 首页 > news >正文

银行数仓项目实战(一)--什么是数据仓库

文章目录

  • 数据仓库
    • 特点
    • 目的:
      • 监管报送
        • 监管报送的系统主要有?
        • 监管报送报送的数据
      • OLTP和OLAP
    • 架构

数据仓库

数据仓库是一个面向主题的,集成的,非易失的且随时间变化的数据集合,用来支持管理人员的决策。
数据仓库是一个环境,而不是一个产品,提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或者不能得到。数据仓库技术是为了有效的把操作型数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称,所做的一切都是为了让用户更快更方便查询所需要的信息,提供决策支持。

特点

1.面向主题的:甲方所关心的业务条线,称之为主题。----面向需求
银行的主题:十大主题
在这里插入图片描述
重要的有产品主题,客户主题,协议主题,事件主题,财务主题…

2.集成的:将业务系统零散数据,根据甲方需求(主题)汇总加工,形成方便分析的业务明细表–业务宽表。
3.非易失的:即数据是稳定的。需要保证数据的完整性、准确性、及时性(离线T+1)(今天分析昨天的)
4.随时间变化的:动态的。

目的:

1.支持管理决策(可视化分析)
2.监管报送
3.数据集市(针对某一个主题进行深度分析OLAP,客户数据集市,营销数据集市,风险数据集市,财务数据集市…)


监管报送

监管报送的系统主要有?

1.数仓管理系统(Data Warehouse Management System,DWMS):用于管理银行数据仓库的建设,维护和运营,包括数据提取,清洗,转换,加载等功能。
2.数据质量管理系统(Data Quality Management System)
:用于确保报送数据的准确性,完整性和一致性,包括数据清洗,校验,修复等功能。
3.报送系统(Reporting System):用于生成并报送符合监管要求的数据报表,确保数据的及时交付和合规性。
4.监控系统(Monitoring System):用于监控数据仓库的运行状态、数据质量情况和报送进度,及时发现和解决问题。
5.安全管理系统(Security Management System):确保数据的安全性和机密性,在数据传输和存储过程中提供加密,权限控制等功能。

监管报送报送的数据

报送的数据通常有以下几类:
1.资产负债数据:如银行的资产情况、负债清空、净资产情况等。
2.交易数据:包括各类交易的明细数据,如存款,贷款,投资,交易结算等。
3.客户数据:涉及客户的身份信息,账户信息,交易行为等数据。
4.风险数据:包括市场风险,信用风险,操作风险等方面的数据。
5.合规数据:涉及银行在法律法规和监管要求下的合规情况数据。


OLTP和OLAP

当今的数据处理主要分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(on-line Analytical Processing)。
OLTP是传统的关系型数据库的主要应用,主要是基本的,日常的事务处理,例如银行交易。
OLAP是数据仓库系统的主要应用。支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。


架构

下面是两种主要的架构
在这里插入图片描述

在这里插入图片描述
1.源数据:包括银行的各种自建系统,核心系统,信贷系统,ECIF(客户系统),中间业务等等…
2.ODS(Operational Data Store)层,即贴源层:操作型数据存储。是最靠近源数据的一层,用来对数据临时存放,打标签(时间戳,数据来源 为了方便溯源)。保持数据的原始性,完整性。
3.SDS标准层:统一数据类型、统一数据字典、数据清洗–清洗脏数据(如空值,特殊符号,重复值,不符合要求的数据)。
4.FDS(Fundational Data Store)基础层/模型层:最重要的一层,根据主题将源数据进行集成,加工,形成明细表–宽表
形成细粒度明细表。是面向主题的体现。
5.ADS(Analytical Data Store)分析层/指标层:根据需求,加工指标数据。将基础层数据加工计算,形成包括机构,客户,产品等各种数据。
6.应用层:可视化分析,监管报送,下游系统提供数据支持–数据集市

相关文章:

  • 独立游戏之路:Tap篇 -- Unity 集成 TapTap 广告详细步骤
  • MySQL触发器基本结构
  • React@16.x(32)useDebugValue
  • flutter 环境搭建(windows)(先装 jdk 建议1.8起步)
  • Spring IOC的优、缺点
  • 视频合成渲染服务解决方案,数字人+PPT+视频云剪辑
  • 搭建RocketMQ主从异步集群
  • vue前段处理时间格式,设置开始时间为00:00:00,设置结束时间为23:59:59
  • Langchain-chatchat: Langchain基本概念
  • SaaS案例分享:成功构建销售渠道的实战经验
  • homework 2024.06.17 math, UI
  • 【Linux硬盘数据读取】WIN10访问linux分区解决方案:ext2fsd
  • 企业内部、与合作伙伴/客户文档协作如何高效安全地收集资料?
  • 安装docker+mysql的一些坑
  • LogicFlow 学习笔记——5. LogicFlow 基础 主题 Theme
  • SegmentFault for Android 3.0 发布
  • 【刷算法】求1+2+3+...+n
  • 230. Kth Smallest Element in a BST
  • GraphQL学习过程应该是这样的
  • Java反射-动态类加载和重新加载
  • Kibana配置logstash,报表一体化
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • PHP 7 修改了什么呢 -- 2
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • Vue--数据传输
  • 纯 javascript 半自动式下滑一定高度,导航栏固定
  • 浮动相关
  • 紧急通知:《观止-微软》请在经管柜购买!
  • 模仿 Go Sort 排序接口实现的自定义排序
  • 排序算法学习笔记
  • 前端代码风格自动化系列(二)之Commitlint
  • 深入浅出webpack学习(1)--核心概念
  • 我看到的前端
  • 消息队列系列二(IOT中消息队列的应用)
  • 用简单代码看卷积组块发展
  • LevelDB 入门 —— 全面了解 LevelDB 的功能特性
  • ​【数据结构与算法】冒泡排序:简单易懂的排序算法解析
  • ​LeetCode解法汇总1276. 不浪费原料的汉堡制作方案
  • ###51单片机学习(1)-----单片机烧录软件的使用,以及如何建立一个工程项目
  • #、%和$符号在OGNL表达式中经常出现
  • (rabbitmq的高级特性)消息可靠性
  • (第30天)二叉树阶段总结
  • (二) Windows 下 Sublime Text 3 安装离线插件 Anaconda
  • (二十九)STL map容器(映射)与STL pair容器(值对)
  • (分布式缓存)Redis分片集群
  • (附源码)springboot金融新闻信息服务系统 毕业设计651450
  • (附源码)springboot人体健康检测微信小程序 毕业设计 012142
  • (附源码)springboot优课在线教学系统 毕业设计 081251
  • (附源码)小程序 交通违法举报系统 毕业设计 242045
  • (计算机网络)物理层
  • (每日持续更新)jdk api之FileFilter基础、应用、实战
  • (实测可用)(3)Git的使用——RT Thread Stdio添加的软件包,github与gitee冲突造成无法上传文件到gitee
  • (四十一)大数据实战——spark的yarn模式生产环境部署
  • (图)IntelliTrace Tools 跟踪云端程序
  • (转)http协议