当前位置: 首页 > news >正文

数据治理项目——深铁集团数据治理规划

目录

一、前言

二、数据治理内容与主要措施

2.1 实施背景

2.2 主要举措

2.2.1 制定数据战略目标

2.2.2 绘制数据治理蓝图

2.2.3 绘制数据治理制度

2.2.4 梳理数据资产目录

三、 应用效果

3.1 数据资产可视化管理

3.2 数据标准治理

3.3 集团大数据平台优化建设


一、前言

   深铁集团成立于1998年7月31日,是深圳市国资委直管的国有独资大型企业,承担着深圳90%以上的轨道交通建设和运营任务。为落实深圳市地铁集团有限公司(下文简称“深铁集团”或“集团”)数字化转型战略,摸清数据资产,统一数据标准,建立数据管控体系,形成数据管理的“深铁法典”,探索出一套具有深铁集团特色的数据标准体系,2021年,深铁集团启动数据治理专项(下文简称“项目”)。项目明确了深铁集团数据治理目标及愿景,绘制了1套覆盖13个核心业务领域的数据治理蓝图,编制了14个数据管理办法、7个数据管理规范以及6个数据设计报告,并盘点梳理出一份接近2万字段的数据资产目录,为后续持续推进深铁集团数据治理工作奠定坚实基础。

二、数据治理内容与主要措施

2.1 实施背景

  随着深铁集团业务的不断发展,信息系统对业务的涵盖不断扩大,应用逐步深入,企业数据规模快速增长,各业务板块积累了丰富的数据资源并打下部分数据管理基础。但是各类业务统计口径不统一,数据质量不高,数据孤岛严重等问题也逐步凸显,难以实现基于数据支撑的业务决策以及运营优化。

   为满足深铁集团经营管理精细化的需求、支持业务数据的分析及应用、促进企业数字化转型发展,亟需构建集团统一数据治理体系,建立相应的管理组织、制度、流程与保障体系,明确数据管控范围,拉通整合数据,以纲领化的要求指导、监督与管理各IT项目中涉及数据领域工作的建设与运维,实现对全集团数据资产管理的指导、监督和管理,确保数据规范、及时、准确和安全,为全面盘活企业数据资产奠定基础。

2.2 主要举措

  项目围绕数据治理工作方法论,建设内容包括:(1)基于现状梳理及对标分析,厘清数据治理战略目标;(2)结合行业经验及深铁集团实际需求,绘制数据治理整体框架及蓝图;(3)通过发布制度流程及技术规范为数据治理工作建章立制;(4)深度盘点各业务领域数据资产,编制跨业务,全链条的数据资产目录。

                              图1:数据治理项目工作方法论

2.2.1 制定数据战略目标

   项目通过问卷调研、现场访谈了解深铁集团业务、数据和数据治理的实际情况以及当前存在的数据问题,根据DCMM数据治理方法论,从内容建设,技术支撑与保障机制层面收集与发现当前深铁集团数据治理领域的现状和主要问题。同时参考同业实践情况,对深铁集团各数据治理领域的成熟度进行评估。

    项目分析发现,深铁集团数据治理问题主要集中在数据问题体现在数据壁垒多,数据共享和追溯困难,主数据管理薄弱,数据质量不高,数据应用处于起步阶段,综合数据治理水平接近于受管理级。虽然具备一定基础,但与行业领先者存在着一定差距,未来具备较大的提升空间,还需进一步提升和完善。

    为应对集团数据治理及共享应用诉求,解决当前面临的数据质量等问题,项目明确了“看的清”、“管的住”、“用的好”的数据治理目标。(1)对深铁数据资产进行盘点,识别核心资产,建立企业级数据资产目录,实现企业级数据能够“看得清”;(2)建立数据治理的组织,制度, 流程和评价考核机制,对数据标准,数据质量,数据安全的核心领域进行管理,实现企业数据能够“管得住”;(3)建立数据应用,利用集团统建的数据平台及相关工具,进行数据分析,展示和共享,实现企业数据能够“用得好”

   基于深铁集团未来业务发展及战略要求,项目明确了集团数据治理的愿景,即应实现对业务运营、业务创新、业务转型的数据赋能。(1)依托大量历史数据的积累,梳理、整合具有分析价值的数据资产,服务于企业经营持续优化,形成数据驱动业务质效提升的新格局,“赋能运营”;(2)依托乘客数据、运行数据的积累,借助客户画像、数据挖掘等技术,深入了解乘客偏好和迫切需求,服务于深铁集团技术服务体系创新,形成数据引领的业务创新的新模式,“赋能创新”;(3)依托行业数据洞察和生态合作伙伴数据共享,分析轨交行业发展趋势,服务于深铁集团业务转型和运营模式升级,形成数据决策业态转型的新体制,“赋能转型”。

                              图2:深铁集团数据治理目标及愿景

2.2.2 绘制数据治理蓝图

  项目以深铁集团数据治理目标为导向,围绕数据全生命周期管理,从数据管理和服务能力的整体角度出发,设计了深铁集团“1+3+1”的数据治理蓝图框架,即1份目录、3套体系、1组平台

1份目录:即深铁集团数据资产盘点及数据资产目录。

  在充分理解数据资产概念的基础上明确全集团的数据资产,梳理数据对象及属性(包括业务属性、技术属性和管理属性等),形成一套可快速准确检索的企业级数据资产目录。

3套体系:

  • (1)数据管理体系,对数据管理和服务行使权力及其控制的活动集合,在数据管理和服务层面之上进行规划、监督和控制,为数据技术体系、数据应用与服务体系提供保障;
  • (2)数据技术体系,涵盖数据治理过程中的各项具体举措,是数据治理框架的核心内容,包含数据架构管理,数据标准管理,数据质量管理,主数据管理,元数据管理、数据安全管理、数据生命周期管理、数据需求管理、数据运维管理和数据应用绩效管理十个领域的内容;
  • (3)数据应用与服务体系,即涵盖数据运用与数据资产价值实现的各项活动,数据应用与服务从数据采集服务、报表查询服务、数据分析挖掘服务以及数据应用体系建设等领域进行数据应用与服务能力的提升和改进

1组平台:即数据支撑平台

   平台是数据治理工作的技术支撑,实现数据资产管理与数据治理、基于数据的业务决策支持、精细化运营分析等相关要求,主要包括数据资产管理平台、数据服务共享平台和数据智能分析平台

   基于“1+3+1”的数据治理框架指引以及集团数据应用与服务体系,全面绘制了深铁集团未来数据治理的工作蓝图。在平台建设层面,项目基于“一切业务数据化,一切数据业务化”的理念,采用“集数据、建标准、创平台、拓应用”四步法进行深铁集团数据平台设计,规划了深铁集团三大数据平台的核心能力及系统边界,为后续深铁集团数据平台建设指明方向。

                    图3:深铁集团数据治理蓝图框架

2.2.3 绘制数据治理制度

    项目编制了包括《深铁集团数据资产管理总纲》、《深铁集团数据定义管理办法》等在内的15个数据管控制度流程,以及包括《深铁集团数据安全规范》、《深铁集团数据资产规范》等在内的7个数据标准管理规范,从制度流程层面,全面搭建深铁集团数据治理框架,为各类数据治理工作建章立制,支持后续集团数据治理工作的有序开展。

2.2.4 梳理数据资产目录

    数据资产是开展数据治理的关键对象,数据资产目录是数据架构设计的重要基础,而数据资产盘点是数据资产管理的前提。通过对数据资产进行规范化、系统化的归并、整理、分类等操作,编制了深铁集团企业级数据资产目录,充分厘清集团数据情况,逐步推进数据资产应用。

   数据资产盘点主要分为业务属性盘点,即将业务过程产生的数据与业务流程进行匹配,梳理企业经营过程产生的全部数据资产,明确“数据有哪些”技术属性盘点,即明确数据在业务系统的分布情况,同时,梳理各数据的技术规则,明确“数据在哪里”管理属性盘点,即明确各盘点数据的部门及岗位归属,梳理企业数据管理现状,明确“数据谁在管”。

    项目深入调研并全面盘点了从L1(主题域分组)到L5级(字段级)的集团数据资产清单,为数据资产目录的梳理奠定基础。基于数据资产盘点成果以及深铁集团全业务能力框架梳理核心端到端流程,提取了核心流程共性数据对象,完成包含5个L1级主题域分组、34个L2级主题域、405个L3级业务对象、2503个L4级逻辑数据实体、19107个L5级数据资产项的集团首个数据资产目录编制,覆盖了深铁集团所有核心业务环节。针对各板块共性的采购,人力,财务管理等业务领域,实现了数据对象的归纳合并,规避了系统孤岛下造成的数据资产割裂等问题。同时制定了数据认责方案,明确了各类数据资产,数据责任部门,支持未来长效化、常态化数据资产盘点、维护及更新的工作要求。

                    图4:深铁集团数据资产目录结构

三、 应用效果

    深铁集团通过数据管理办法及数据管理规范为抓手,全面推进各类业务部门对数据治理蓝图的实施落地,并结合集团信息项目管理要求,落实各类系统建设及运维优化过程中的数据治理工作。此外,深铁集团着重考虑从数据资产可视化管理、数据标准治理、集团大数据平台优化建设等方面专项推进数据治理蓝图实施落地工作,逐步实现基础数据的可视、可用、可管理,为后续多场景、多维度数据应用奠定基础。

3.1 数据资产可视化管理

   承接项目盘点梳理的数据资产目录成果,深铁集团同步建设了数据资产目录管理系统,承载了集团的数据资产目录管理要求并对外提供查询服务,规范集团各单位对数据资产目录的管理维护操作,使数据资产目录的管理条理化,可视化,规范化,流程化,实现数据资产在各单位及部门间的共享,融合及使用。目前系统已正式上线投入使用,支持全集团级员工对数据资产、数据标准的浏览及管理。

                    图5:深铁集团数据资产目录管理系统

3.2 数据标准治理

    承接项目设计并正式发布的《数据标准规范》及《数据标准管理办法》,统一各单位数据语言,推进跨部门数据的互通与共享。

   目前已完成“员工”、“合同”、“会计科目”、“线路”、“站点”、“枢纽”等核心主数据的数据标准编制。其中着重统一了相关数据对象的编码规则及分类标准,同时梳理了集团通用属性字段及各业务的业务自有字段,针对相关字段明确定义了其业务属性、技术属性、管理属性,从业务口径层面(包括字段名称、业务定义等)、技术口径层面(数据类型、数据长度、数据精度等)、管理口径层面(标准责任部门等)实现了全集团的统一。此外,以相关标准为法则,各业务及系统也在逐步推进落标、贯标及历史数据质量清洗工作,持续落实集团“赋能运营”、“赋能创新”、“赋能转型”的数据治理工作愿景。

3.3 集团大数据平台优化建设

    结合项目技术平台规划方案,深铁集团持续优化大数据平台技术能力及应用范围,对内实现关键系统数据采集、数据共享,实现互联互通,提高应用系统部署效率,节约部署成本对外提供统一的数据接口服务,实现与外部市国资委和政数局等单位数据共享。同时,集团大数据平台作为资源管理抓手的一部分,将数据集成标准作为新建IT项目的竣工验收标准之一,对新建或改造信息化系统制定了统一数据集成、入湖标准,实现了数据集成的统一管理,不断提升集团整体数据质量,为跨单位、跨平台的数据共享及多元化数据分析应用奠定基础。

参考文章:

深铁集团数据治理规划项目

相关文章:

  • 【从零到一手撕脚手架 | 第三节】项目集成CommitLInt+ESLint+Prettier+StyleLint+LintStaged
  • Leetcode【双指针法】
  • 海山数据库(He3DB)原理剖析:浅析OLAP数据库计算引擎中的统计信息
  • 机器学习——概述总结
  • MongoDB【应用 01】通过_id获取记录创建时间(生成规则+解析步骤+源码分享)
  • 计算机组成原理(存储器)
  • 全量知识系统 程序详细设计 之 先验逻辑-实现:从“平凡”回到“平凡” (QA 百度搜索)
  • Echarts-实现地图并轮播地图信息
  • WebView的使用与后退键处理
  • CRMEB多商户商城系统,不止B2B2C
  • 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(八)- 向量整数算术指令
  • 【c++】string类常见接口函数
  • SpringMVC项目入门
  • python 读取文件内容每一行,写入另一个文件内
  • 微服务-7 Docker
  • Android组件 - 收藏集 - 掘金
  • Centos6.8 使用rpm安装mysql5.7
  • ES10 特性的完整指南
  • java取消线程实例
  • JS实现简单的MVC模式开发小游戏
  • mysql外键的使用
  • Node 版本管理
  • PhantomJS 安装
  • 给第三方使用接口的 URL 签名实现
  • 给自己的博客网站加上酷炫的初音未来音乐游戏?
  • 开发基于以太坊智能合约的DApp
  • 如何优雅地使用 Sublime Text
  • 网络应用优化——时延与带宽
  • 微信支付JSAPI,实测!终极方案
  • 为物联网而生:高性能时间序列数据库HiTSDB商业化首发!
  • 学习ES6 变量的解构赋值
  • 一加3T解锁OEM、刷入TWRP、第三方ROM以及ROOT
  • 在Docker Swarm上部署Apache Storm:第1部分
  • linux 淘宝开源监控工具tsar
  • 整理一些计算机基础知识!
  • ​io --- 处理流的核心工具​
  • ​软考-高级-系统架构设计师教程(清华第2版)【第15章 面向服务架构设计理论与实践(P527~554)-思维导图】​
  • #vue3 实现前端下载excel文件模板功能
  • #我与Java虚拟机的故事#连载06:收获颇多的经典之作
  • (26)4.7 字符函数和字符串函数
  • (3)STL算法之搜索
  • (博弈 sg入门)kiki's game -- hdu -- 2147
  • (超详细)2-YOLOV5改进-添加SimAM注意力机制
  • (二) Windows 下 Sublime Text 3 安装离线插件 Anaconda
  • (分布式缓存)Redis哨兵
  • (附程序)AD采集中的10种经典软件滤波程序优缺点分析
  • (附源码)spring boot球鞋文化交流论坛 毕业设计 141436
  • (附源码)springboot宠物医疗服务网站 毕业设计688413
  • (附源码)springboot学生选课系统 毕业设计 612555
  • (一)spring cloud微服务分布式云架构 - Spring Cloud简介
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • (转)h264中avc和flv数据的解析
  • (转载)PyTorch代码规范最佳实践和样式指南
  • 、写入Shellcode到注册表上线
  • .【机器学习】隐马尔可夫模型(Hidden Markov Model,HMM)