当前位置: 首页 > news >正文

什么是标签?跟数据中台有什么关系?终于有人讲明白了

导读:本文带你了解标签在数据中台中的位置。

作者:任寅姿 季乐乐

来源:大数据DT(ID:hzdashuju)

01 什么是标签

标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的。

从粒度上来讲,标签往往映射为某一对象的属性,包括固有属性和动态属性,一般都需要结构化到字段粒度,保障可被后续数据服务便捷使用。它面向数据应用的业务端,核心解答的是数据怎么用、资产价值在哪里的问题。根据加工方式的不同,标签可以分成基础类标签、统计类标签和算法类标签。

02 什么是数据中台

伴随着云计算、大数据、人工智能等技术的快速发展,企业数字化、智能化转型步伐逐渐加快。

数据中台是2018年逐渐兴起的数据概念,核心要义在于增援未来,以发展的眼光解决企业未来可能面临的各种场景问题。面对不确定的未来,企业需要组织沉淀可复用的标签资产,加强数据服务能力,构建出自己的数据中台,才能符合数字化转型的时代要求。

定义角度看,数据中台是一套可持续“让企业数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,以有形的产品和实施方法论为支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。

架构角度看,数据中台上承业务数据积累,通过自己的数据平台工具,将原始数据加工成数据资产,并通过数据资产服务化下启数据应用场景,帮助业务端或管理端降本增效。数据中台不只是一套生产加工的流程,它对企业的战略定位、组织保障、基础设施等方面都产生了深远的影响,如图2-14所示。

▲图2-14 数据中台架构图

实施角度看,数据中台是以数据资产为核心,以实现数据资产可见、可懂、可用、可运营的系列目标为出发点,配以平台工具、流程规范、应用建设等必要环节,最终落地的数据解决方案,如图2-15所示。

▲图2-15 以数据资产为核心的实施配套

03 标签在其中的重要位置

将企业的完整技术架构图抽丝剥茧,可以看到“标签”在数据中台中的具体位置:数据中台位于云底座与上层业务应用之间,即位于稳定厚重的技术大后台与灵活多变的业务小前台之间。通过数据中台对底层复杂技术能力的抽象封装,前端业务可以自由、轻便地使用数据能力,弥合前后端步伐不一致的问题。

在数据中台内部,具体又细分出开发工具层、数据资产层、资产管理层、数据服务层、数据运营体系、数据安全体系等模块,如图2-16所示。

▲图2-16 标签在数据中台中的位置

原始汇入的数据通过开发工具层转变为企业自有的数据资产;在资产管理层对数据资产进行不断的治理优化;最终通过资产服务化将数据资产输送到业务各端,实现数据价值;统一的运营体系和标准安全管理主要从流程机制层面保障整个数据中台的平稳有序运行。

在数据中台中,开发或管理工具是可以直接采购的,运营体系和标准安全规范的方法论是可以学习的,但是数据资产和数据服务必须是企业自行建设和实施的结果,它们是数据中台的核心部分,没有捷径可走。

数据资产和数据服务中最核心的是标签:数据资产本身以标签为组织载体,而数据服务本质上是一种将标签传递给业务端使用的价值管道。标签是数据中台价值链路中“核心的核心”。

关于作者:任寅姿(花名:影姿),资深产品总监、数澜研究院院长拥有超过10年的数据产品经验,原阿里巴巴集团数据产品专家,曾负责集团消费者标签类目体系、DMP精准营销等系统的数据资产设计与实施。2016年加入数澜科技,负责管理公司产品团队,系统提升团队数据思维、数据资产设计能力及数据服务应用经验,是数据中台理论定义及体系构建的核心参与者。

季乐乐(花名:寒泉),政法行业资深专家、产品专家拥有超过6年的政法行业产品经验,原南京通达海区域负责人,专注于研究数字检务、智慧法院等领域。

本文摘编自《标签类目体系:面向业务的数据资产设计方法论》,经出版方授权发布。

延伸阅读《标签类目体系》

点击上图了解及购买

转载请联系微信:DoctorData

推荐语:标签类目体系是数据中台理念落地的核心组成部分,是实现数据资产可复用、柔性组合使用、降低数据应用试错门槛的强力支撑。本书旨在培养资深的数据资产架构师及数据运营专家,以方法教育而非工具实施的方式助力企业建立自身的数据资产化能力,将数据能力最大限度地转化为商业价值。


扫码关注【华章计算机】视频号

每天来听华章哥讲书

更多精彩回顾

书讯 | 6月书讯 | 初夏,正好读新书

资讯 | 《数据安全法》表决通过!最新解读来了

书单 | 8本书助你零基础转行数据分析岗

干货 | 阿里云官方出品:全面总结阿里云云原生架构方法论与实践经验

收藏 | 手把手教你利用JS给图片打马赛克

上新 | 【新书速递】深入浅出联邦学习

赠书 | 【第61期】盘点云计算领域不可不读的9本书

点击阅读全文购买

相关文章:

  • 7月书讯(上)| 读书开启下半年
  • 终于有人把卷积神经网络(CNN)讲明白了
  • 7月书讯(下)| 读书开启下半年
  • 数据中台、标签、数据资产相关的15个名词解释
  • 【新书速递】深入理解Nginx底层原理与设计,轻松应对高并发
  • CSAPP,永远滴神!
  • 周志明:《凤凰架构:构建可靠的大型分布式系统》
  • 【第62期】学会数据分析,抢占职场风口机遇
  • 腾讯数据科学家详解用户选择行为分析核心模型
  • 【新书速递】人人可懂的深度学习
  • 开发人工智能为什么要用Python?
  • 【新书速递】首本零代码书籍问世
  • MySQL 十大常用字符串函数
  • 手把手教你用Python求最大值和最小值
  • TIOBE 7 月编程语言排行榜:C、Java 和 Python 争夺第一
  • 【跃迁之路】【641天】程序员高效学习方法论探索系列(实验阶段398-2018.11.14)...
  • 2018天猫双11|这就是阿里云!不止有新技术,更有温暖的社会力量
  • 78. Subsets
  • codis proxy处理流程
  • ES2017异步函数现已正式可用
  • PHP CLI应用的调试原理
  • quasar-framework cnodejs社区
  • vue2.0一起在懵逼的海洋里越陷越深(四)
  • 开源SQL-on-Hadoop系统一览
  • 理解 C# 泛型接口中的协变与逆变(抗变)
  • 聊聊sentinel的DegradeSlot
  • 什么软件可以剪辑音乐?
  • 进程与线程(三)——进程/线程间通信
  • 摩拜创始人胡玮炜也彻底离开了,共享单车行业还有未来吗? ...
  • ​软考-高级-信息系统项目管理师教程 第四版【第19章-配置与变更管理-思维导图】​
  • #鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
  • $jQuery 重写Alert样式方法
  • (33)STM32——485实验笔记
  • (M)unity2D敌人的创建、人物属性设置,遇敌掉血
  • (Matalb时序预测)WOA-BP鲸鱼算法优化BP神经网络的多维时序回归预测
  • (切换多语言)vantUI+vue-i18n进行国际化配置及新增没有的语言包
  • (十五)使用Nexus创建Maven私服
  • (学习日记)2024.03.12:UCOSIII第十四节:时基列表
  • (幽默漫画)有个程序员老公,是怎样的体验?
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • .bat批处理(九):替换带有等号=的字符串的子串
  • .form文件_SSM框架文件上传篇
  • .net 7 上传文件踩坑
  • .Net Memory Profiler的使用举例
  • .Net mvc总结
  • .net 程序 换成 java,NET程序员如何转行为J2EE之java基础上(9)
  • .NET 设计模式—简单工厂(Simple Factory Pattern)
  • .NET 中的轻量级线程安全
  • .NET运行机制
  • .Net转前端开发-启航篇,如何定制博客园主题
  • @LoadBalanced 和 @RefreshScope 同时使用,负载均衡失效分析
  • [2544]最短路 (两种算法)(HDU)
  • [BUUCTF]-Reverse:reverse3解析
  • [bzoj1038][ZJOI2008]瞭望塔
  • [C]编译和预处理详解