数仓建模:DWS层该如何建设?如何设计通用数据模型?
目录
0 引言
1 数仓分层架构
2 数据作用域与边界划分
3 DWS层构建方法
4 构建示例【真实项目案例】
案例1:某汽车经销商
模型层:用户画像宽表
基本要求
模型建设
案例2:某轨道交通行业
如何建设业务指标
模型构建
5 DWS层评价方法
6 小结
0 引言
在数仓建设初期,通常大家都会有这样的疑问,数仓为什么要分这么多层,每一层都要开发,我直接使用原始数据进行报表开发可以吗?或是我直接使用dwd层清洗好的数据作为ADS层开发可以吗?为什么要做公共汇总层的开发?于是数仓架构就变成了ods->dwd->ads,这样做不是不可以,在业务初期指标不是很多的情况下,我们为了能够快速构建应用看板可以这么做,但是随着业务的场景越来越复杂,指标越来越多,业务看数的需求变得更多的时候,这种模式就给IT人员造成了困扰,每一次需求都要重新开发一次,如果需求变更、迭代的快,明显数据开发人员开发速度是跟不上提需求的速度,这时候就需要我们数仓开发的同学去做好数据、指标的沉淀,开发更高效的模型来快速应对业务不断更新与迭代的各类需求,因此DWS公共汇总服务层便应运而生。那么如何构建好数据服务层,做好数据、指标的沉淀呢?本文就针对这一问题展示详细的讨论。
1 数仓分层架构
首先我们来回顾一下数仓分层整体架构