MATLAB算法实战应用案例精讲-【人工智能】数据集市(概念篇)
目录
前言
几个高频面试题目
数据集市和数据仓库的区别和联系
数据集市、数据湖和数据仓库之间的区别
数据仓库、数据集市、数据湖、数据海及其之间的关系?
一、数据仓库是什么
二、数据集市是什么
三、数据湖是什么
四、数据海是什么
五、4个概念之间的关系和区别
核心概念与联系
数据资源
数据共享
数据集市与数据共享平台
数据标准化
数据规范化
数据标准化与规范化的联系
算法原理
什么是数据集市
为什么要创建数据集市?
谁需要使用数据集市(以及如何使用)?
数据集市的数据治理策略有哪些?
如何为数据集市选择合适的数据库技术?
如何选择合适的数据集市工具和平台?
数据集市的数据结构
数据集市类型
数据集市性能优化和负载均衡的技术方案有哪些?
实施数据集市的步骤
数据仓库建模与数据集市建模
数据集市的结构
星型
雪花
保险库
如何构建一个数据集市?
如何确保数据集市的数据质量?
搭建数据集市与数据模型
适用场景
数据集市在中国金融行业的具体应用
数据集市的优缺点
优点
缺点
未来发展趋势与挑战
数据集市的未来
前言
数据集市(Data Mart),也叫数据市场,数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。
从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据中心的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。数据中心的用户希望数据是由他们熟悉的术语表现的。