当前位置: 首页 > news >正文

数据中台、标签、数据资产相关的15个名词解释

导读:本文将对数据中台、数据、标签相关的关键名词术语进行定义和解释。


作者:任寅姿 季乐乐

来源:大数据DT(ID:hzdashuju)

01 数据

数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态及相互关系等进行记载的物理符号或这些物理符号的组合。数据可以是连续的,比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0和1的形式表示。

在《标签类目体系》一书所论述的方法论中,“数据类目体系”概念中的“数据”是狭义的定义,单指企业原始拥有的、未经整理的信息载体。

02 数据资产

在传统概念中,企业认为其所拥有的所有数据资源都是数据资产,例如存放了好几十年的纸质文件、光盘、视频、音频等。这些资源还停留在原始数据阶段,必须从中整理和提炼出可用的信息项,才能真正为企业产生价值。

因此当前对数据资产主要关注其精准定义(狭义):由企业拥有或控制的,能够直接为企业带来经济利益的数据资源。通常需要有较好的组织形式,数据资产才可以被编目、被管理、被高效使用。

03 数据中台

数据中台是一套可持续“让企业数据用起来”的机制。数据中台是依据企业特有的业务模式和组织架构,以有形的产品和实施方法论为支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。

04 标签

标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的。

从粒度上来讲,标签往往映射为某一对象的属性,包括固有属性和动态属性,一般都需要结构化到字段粒度,保障可被后续数据服务便捷使用。它面向数据应用的业务端,核心解答的是数据怎么用、资产价值在哪里的问题。根据加工方式的不同,标签可以分成基础类标签、统计类标签和算法类标签。

05 元标签

元标签是标签的标签,即对标签的属性信息(特别是业务化属性信息)梳理。通过元标签,业务人员可以快速理解标签定义,获取标签设计、加工、管理、使用等相关信息。

06 类目体系

类目体系指的是对某一类item(事物)的分类、架构、组织方法。类目体系结构可以用树状结构来类比,第一级分支称为一级类目,从第一级分支中长出的第二级分支称为二级类目,从第二级分支中长出的第三级分支称为三级类目,以此类推。

没有上一级类目的叫一级类目,没有下一级分类的类目叫叶子类目,挂在叶子类目上的具体叶子就是item。有下级细分类目的类目是下一级类目的父类目,有上级类目的类目是上一级类目的子类目。图2-17所示为标签体系类目。

▲图2-17 标签体系类目

类目体系设计好之后,可以将item分入合适的类目中。例如对商品的组织梳理可以形成商品类目体系,对标签的组织梳理可以形成标签类目体系。

07 数据类目体系

数据类目体系是将企业原始拥有的数据字段,采用类目体系的方式进行梳理所形成的目录结构。

08 标签类目体系

标签类目体系是将企业业务上所需的标签,采用类目体系的方式进行梳理所形成的目录结构。

09 对象

标签类目体系方法论中的对象指现实世界中所需要研究的目标。结合数据库理论,实体(Entity)和关系(Relationship)在标签类目体系方法论中都属于对象,因此从对象类型上可以分为实体对象和关系对象,其中实体对象还可以细分为“人”和“物”。

数据世界中的对象可以和现实世界中的事物相映射,“人”“物”“关系”是对现实世界所有事物的数据抽象。

10 人

标签类目体系方法论中的“人”指会主动发起行为动作的对象。人包括自然人、自然人群体、法人、法人群体等,例如消费者、消费者协会、电商企业、电商企业联合会等。

11 物

标签类目体系方法论中的“物”指行为动作中的被动对象。物包括物品、物体、物品集合等,例如商品、仓库等。

12 关系

标签类目体系方法论中的“关系”指人和物、人和人、物和物等两个对象间发生的某种连接。关系包括行为关系、归属关系、社交关系、同好关系等各种强、弱关系。

13 场景

标签类目体系方法论中的场景指某环境下,具体对象(人、物、关系)在时空中的表现。在某场景内,对象可能是某个人或某群人,可能是某个物或某群物,也有可能是发生着的某种关系或某系列关系集合。

因此任何一个事件,无论简单还是复杂,都可以用场景来表达。例如,“午后我在发呆”“机器设备异常运行”“消费记录源源不断产生”等都是场景。

前台标签类目体系中的场景往往指的是前台业务使用数据资产服务解决自身业务问题、提升业务效率的数据应用场景。

14 后台类目体系

标签类目体系在企业实际应用过程中可以拆分为后台类目体系和前台类目体系。后台类目体系面向数据资产管理人员,是企业数据资产的全集,较为稳定,按照统一的分类方式进行标签的挂载、查看、管理。

资产设计师或管理员可以创建、维护后台类目体系,业务人员只能查看使用,无法修改后台类目体系的类目格式。只有拥有一定权限的数据资产管理员才可以在经过审批的情况下低频修改后台类目体系。

15 前台类目体系

业务人员通过后台类目体系选择并获得标签使用权后,可以根据场景需要,将标签按照前台场景组织新类目,形成前台类目体系。

例如在后台类目体系中,“性别”属于【基本属性】分类,“消费力”属于【能力价值】分类,但前台业务想通过“性别”“消费力”等维度对会员进行客户洞察分析,那么可以在前台创建一个【客户洞察】的分类,将“性别”“消费力”等标签挂入这个前台分类中。

前台类目与后台类目仅存在映射关联,并不直接挪动标签的物理位置,因而前后台是相互隔离的。因此前台类目可以灵活多变,并不影响后台类目的稳定统一。

关于作者:任寅姿(花名:影姿),资深产品总监、数澜研究院院长拥有超过10年的数据产品经验,原阿里巴巴集团数据产品专家,曾负责集团消费者标签类目体系、DMP精准营销等系统的数据资产设计与实施。2016年加入数澜科技,负责管理公司产品团队,系统提升团队数据思维、数据资产设计能力及数据服务应用经验,是数据中台理论定义及体系构建的核心参与者。

季乐乐(花名:寒泉),政法行业资深专家、产品专家拥有超过6年的政法行业产品经验,原南京通达海区域负责人,专注于研究数字检务、智慧法院等领域。

本文摘编自《标签类目体系:面向业务的数据资产设计方法论》,经出版方授权发布。

延伸阅读《标签类目体系》

点击上图了解及购买

转载请联系微信:DoctorData

推荐语:标签类目体系是数据中台理念落地的核心组成部分,是实现数据资产可复用、柔性组合使用、降低数据应用试错门槛的强力支撑。本书旨在培养资深的数据资产架构师及数据运营专家,以方法教育而非工具实施的方式助力企业建立自身的数据资产化能力,将数据能力最大限度地转化为商业价值。


扫码关注【华章计算机】视频号

每天来听华章哥讲书

更多精彩回顾

书讯 | 6月书讯 | 初夏,正好读新书

资讯 | 《数据安全法》表决通过!最新解读来了

书单 | 8本书助你零基础转行数据分析岗

干货 | 当机器学习遇上隐私保护,聊聊联邦学习和分布式机器学习

收藏 | 终于有人把卷积神经网络(CNN)讲明白了

上新 | 【新书速递】打通数据科学三要素——数据科学实战性手册

赠书 | 【第61期】盘点云计算领域不可不读的9本书

点击阅读全文购买

相关文章:

  • 【新书速递】深入理解Nginx底层原理与设计,轻松应对高并发
  • CSAPP,永远滴神!
  • 周志明:《凤凰架构:构建可靠的大型分布式系统》
  • 【第62期】学会数据分析,抢占职场风口机遇
  • 腾讯数据科学家详解用户选择行为分析核心模型
  • 【新书速递】人人可懂的深度学习
  • 开发人工智能为什么要用Python?
  • 【新书速递】首本零代码书籍问世
  • MySQL 十大常用字符串函数
  • 手把手教你用Python求最大值和最小值
  • TIOBE 7 月编程语言排行榜:C、Java 和 Python 争夺第一
  • 【新书速递】嵌入式Linux驱动领域开发的实战指南
  • 2021半年盘点,这些经典更新了!
  • ​2021半年盘点,不想你错过的重磅新书
  • 【第63期】机器人时代已来!推荐几本机器人学硬核好书
  • __proto__ 和 prototype的关系
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • ESLint简单操作
  • GraphQL学习过程应该是这样的
  • input的行数自动增减
  • java8-模拟hadoop
  • JavaScript 奇技淫巧
  • Javascript基础之Array数组API
  • JavaScript实现分页效果
  • magento 货币换算
  • python大佬养成计划----difflib模块
  • Python学习之路13-记分
  • React-生命周期杂记
  • 闭包--闭包作用之保存(一)
  • 彻底搞懂浏览器Event-loop
  • 高程读书笔记 第六章 面向对象程序设计
  • 开发基于以太坊智能合约的DApp
  • 首页查询功能的一次实现过程
  • 文本多行溢出显示...之最后一行不到行尾的解决
  • 我建了一个叫Hello World的项目
  • 我这样减少了26.5M Java内存!
  • 主流的CSS水平和垂直居中技术大全
  • 翻译 | The Principles of OOD 面向对象设计原则
  • ​flutter 代码混淆
  • ​LeetCode解法汇总307. 区域和检索 - 数组可修改
  • ​力扣解法汇总946-验证栈序列
  • # Swust 12th acm 邀请赛# [ A ] A+B problem [题解]
  • #Js篇:单线程模式同步任务异步任务任务队列事件循环setTimeout() setInterval()
  • (3)选择元素——(17)练习(Exercises)
  • (4)Elastix图像配准:3D图像
  • (DenseNet)Densely Connected Convolutional Networks--Gao Huang
  • (附源码)ssm户外用品商城 毕业设计 112346
  • ***利用Ms05002溢出找“肉鸡
  • .gitignore文件_Git:.gitignore
  • .NET 4.0中使用内存映射文件实现进程通讯
  • .net操作Excel出错解决
  • .net反编译的九款神器
  • .NET教程 - 字符串 编码 正则表达式(String Encoding Regular Express)
  • @manytomany 保存后数据被删除_[Windows] 数据恢复软件RStudio v8.14.179675 便携特别版...