当前位置: 首页 > news >正文

ETL数据同步之DataX,附赠一套DataX通用模板

今天跟大家分享数据同步datax的模板,小伙伴们简单直接借鉴使用。

还记得上一篇关于大数据DS调度工具的分享嘛?

主流大数据调度工具DolphinScheduler之数据ETL流程-CSDN博客

里面的核心就是采用了DATAX的数据同步原理。

一,什么是DataX

DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、HDFS、Hive、ADS、HBase、Kingbase 等各种异构数据源之间的数据同步功能。

二,DataX模板

这个模板是把hive的表数据同步到kingbase数据库。

如果你要操作其他数据库之间的同步,可以借鉴,都一样。

这个模板怎么来的??

当然是上次成功调度数据实现同步,从日志中copy来的。

所以,正确性大家毋庸置疑。

如图,JSON里包括两个对象,

一个是content(包括了reader,writer ,connection 等等),

一个是setting。

注意这里的写入模式 writemode 是 upddate,

这里就是在(人大金仓数据库)该表设置的主键。

主流大数据调度工具DolphinScheduler之数据ETL流程-CSDN博客

截取上次链接里面的一张图片来解释一下:

那么设置主键的意义何在呢?

当然是不能同时存在两个相同主键的数据了。

就如同你在咱中国,你的身份证就只能是唯一的一样。

如果一次性多条相同主键的数据,从hive同步kingbase数据库,会随机同步任一一条数据。

如果下次同步的数据里存在与数据库同主键的数据,同步过去会进行数据的更新。

上面的jdbcURL和密码都被我隐藏了哈哈哈。


欢迎大家点赞收藏关注,会不时分享实际工作中的知识点,让智慧不浮于表面。

下次再见!

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • vue视频、图片自动轮播并伴随进度条
  • 网页制作技术在未来会如何影响人们的生活?
  • Hi6274 反激式20瓦电源芯片
  • PHP场地预约共享茶室棋牌室小程序系统源码
  • el-table表头使用el-dropdown出现两个下拉框
  • Linux常用命令(简要总结)
  • android R ext4 image打包脚本介绍
  • ​1:1公有云能力整体输出,腾讯云“七剑”下云端
  • k8s安装powerjob
  • 一、单例模式
  • 【PPT笔记】1-3节 | 默认设置/快捷键/合并形状
  • 分布式服务框架zookeeper+消息队列kafka
  • 【时时三省】单元测试 简介
  • 比较HTTP/1.1、HTTP/2
  • vue2+antd实现表格合并;excel效果
  • [微信小程序] 使用ES6特性Class后出现编译异常
  • 2019.2.20 c++ 知识梳理
  • C# 免费离线人脸识别 2.0 Demo
  • CSS选择器——伪元素选择器之处理父元素高度及外边距溢出
  • Docker入门(二) - Dockerfile
  • Js基础知识(四) - js运行原理与机制
  • Just for fun——迅速写完快速排序
  • oschina
  • uva 10370 Above Average
  • vue:响应原理
  • 从地狱到天堂,Node 回调向 async/await 转变
  • 从零开始在ubuntu上搭建node开发环境
  • 分享自己折腾多时的一套 vue 组件 --we-vue
  • 基于OpenResty的Lua Web框架lor0.0.2预览版发布
  • 两列自适应布局方案整理
  • 区块链分支循环
  • 我有几个粽子,和一个故事
  • 携程小程序初体验
  • 正则学习笔记
  • ​【数据结构与算法】冒泡排序:简单易懂的排序算法解析
  • ​埃文科技受邀出席2024 “数据要素×”生态大会​
  • # Redis 入门到精通(八)-- 服务器配置-redis.conf配置与高级数据类型
  • #LLM入门|Prompt#3.3_存储_Memory
  • (C语言)球球大作战
  • (超详细)2-YOLOV5改进-添加SimAM注意力机制
  • (论文阅读22/100)Learning a Deep Compact Image Representation for Visual Tracking
  • (十一)图像的罗伯特梯度锐化
  • (学习日记)2024.02.29:UCOSIII第二节
  • (一一四)第九章编程练习
  • (转)为C# Windows服务添加安装程序
  • (转载)Google Chrome调试JS
  • *算法训练(leetcode)第四十天 | 647. 回文子串、516. 最长回文子序列
  • .net core webapi 大文件上传到wwwroot文件夹
  • .net core使用RPC方式进行高效的HTTP服务访问
  • .NET Windows:删除文件夹后立即判断,有可能依然存在
  • @GetMapping和@RequestMapping的区别
  • @kafkalistener消费不到消息_消息队列对战之RabbitMq 大战 kafka
  • [2023-年度总结]凡是过往,皆为序章
  • [Android 数据通信] android cmwap接入点
  • [Android]通过PhoneLookup读取所有电话号码