当前位置: 首页 > news >正文

kettle从入门到精通 第七五课 ETL之kettle血缘,数据血缘

在了解kettle血缘之前,咱们先来了解下什么是数据血缘?

1、数据血缘定义(来自gpt)

数据血缘(Data Lineage)是指在数据管理和数据分析中追踪数据的源头、流向和处理过程的能力。具体来说,数据血缘描述了数据如何被创建、变换和移动,以及这些过程中数据的路径和影响。它有助于理解数据的可靠性、完整性和可信度,是数据治理和合规性的重要组成部分。

在数据血缘中,常见的元素包括:

  1. 数据起源和输入:数据的来源,即数据是从何处获取的,可以是数据库、文件、API等。
  2. 数据转换和处理:数据如何被修改、转换、整合或聚合,包括数据清洗、计算和推断过程。
  3. 数据输出和消费:经过处理后的数据被用于何种用途,可能是生成报表、支持决策、供给其他系统等。

2、阿里数据血缘定义

数据血缘可以用于查看表和表、字段和字段之间的血缘关系,从而辅助业务进行数据的溯源和管理,在作业异常时也可以帮助业务分析上下游作业影响。

 3、数据血缘管理

1)数据血缘基于数据流动,基于etl,假如没有中场景,也就不需要数据血缘。

2)数据血缘分为表级别血缘和字段级别血缘,一般情况下做到表级别血缘就可以了。这里说的表包含表和视图。

4、什么是kettle血缘

kettle是etl工具,所以kettle血缘的意思就是通过kettle的转换文件将血缘关系解析出来,通过页面呈现处理,方便排查问题。

4、血缘存储工具

推荐neo4j图数据库,下图基于neo4j创建两个节点,然后建立关系的一个截图。后续会整理介绍下neo4j的相关知识。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【笔记】先求修改没保存的文本文件-在虚拟机中输入 yum makecache报错
  • 【Diffusion学习】【生成式AI】Diffusion Model 原理剖析 (2/4) (optional)【公式推导】
  • 微信小程序开发基础知识6----使用npm包
  • 探索Mojo编程语言:AI开发者的新宠儿
  • STM32学习和实践笔记(40):DS18B20温度传感器实验
  • 有关电力电子技术的一些相关仿真和分析:⑤交-直-交全桥逆变+全波整流结构电路(MATLAB/Siumlink仿真)
  • 1.3- Zygote
  • Prometheus 云原生 - 微服务监控报警系统 (Promethus、Grafana、Node_Exporter)部署、简单使用
  • goaccess分析json格式日志
  • CORDIC Translate
  • 【C/C++】内存相关
  • 最接近的三数之和
  • 【Linux】Vim 使用教程
  • C# .net6使用Hangfire
  • 手写new
  • 【技术性】Search知识
  • 【译】理解JavaScript:new 关键字
  • CEF与代理
  • iOS筛选菜单、分段选择器、导航栏、悬浮窗、转场动画、启动视频等源码
  • JavaScript 事件——“事件类型”中“HTML5事件”的注意要点
  • JavaScript服务器推送技术之 WebSocket
  • Lucene解析 - 基本概念
  • MySQL用户中的%到底包不包括localhost?
  • SegmentFault 社区上线小程序开发频道,助力小程序开发者生态
  • VUE es6技巧写法(持续更新中~~~)
  • windows下如何用phpstorm同步测试服务器
  • 读懂package.json -- 依赖管理
  • 浮现式设计
  • 关键词挖掘技术哪家强(一)基于node.js技术开发一个关键字查询工具
  • 猫头鹰的深夜翻译:Java 2D Graphics, 简单的仿射变换
  • 模型微调
  • 批量截取pdf文件
  • 普通函数和构造函数的区别
  • 前端面试之闭包
  • 设计模式(12)迭代器模式(讲解+应用)
  • 实战:基于Spring Boot快速开发RESTful风格API接口
  • 视频flv转mp4最快的几种方法(就是不用格式工厂)
  • 赢得Docker挑战最佳实践
  • 用简单代码看卷积组块发展
  • 在electron中实现跨域请求,无需更改服务器端设置
  • 责任链模式的两种实现
  • 自动记录MySQL慢查询快照脚本
  • k8s使用glusterfs实现动态持久化存储
  • Linux权限管理(week1_day5)--技术流ken
  • ​决定德拉瓦州地区版图的关键历史事件
  • ###C语言程序设计-----C语言学习(3)#
  • #AngularJS#$sce.trustAsResourceUrl
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • (10)Linux冯诺依曼结构操作系统的再次理解
  • (C)一些题4
  • (八十八)VFL语言初步 - 实现布局
  • (创新)基于VMD-CNN-BiLSTM的电力负荷预测—代码+数据
  • (二)fiber的基本认识
  • (二)JAVA使用POI操作excel
  • (二十五)admin-boot项目之集成消息队列Rabbitmq