当前位置: 首页 > news >正文

ETL数据集成丨主流ETL工具(ETLCloud、DataX、Kettle)数据传输性能大PK

目前市面上的ETL工具众多,为了方便广大企业用户在选择ETL工具时有一个更直观性能方面的参考值,我们选取了目前市面上最流行的三款ETL工具(ETLCloud、DataX、Kettle)来作为本次性能传输的代表,虽然性能测试数据有很多相关文章都有评测但是基本上也是各说各话或在不同条件下的对比,缺少一个在公平环境和数据量下的直观对比和一个可性的评测结果, ETLCloud作为国内ETL工具的代表本次我们采用线上直播的方式向广大用户进行了现场的性能评测,评测可以说是在相当公平公正的情况下直播进行的,如果用户想亲自进行评测也可以按照本文后面的配置要求和版本下载后进行对比评测。

本次直播的内容最主要是测试在不同数据量100W-1000W下,MySQL、SQLServer、Postgre SQL之间进行数据传输时ETL的最快传输速度,每种工具均采用最快的5通道进行批量数据插入,所有ETL工具采用公开的社区或开源版本进行对比评测,不针对任何一款ETL工具进行单独的调优,因为很多用户在下载后也是直接使用很少会进行高级别参数的调优,所以在这种情况下更能代表这款ETL工具真实使用场景时的传输性能。

本次评测的结果ETLCloud相对于kettle快了24.16%的性能,相对于DataX快了27.8%的性能,同时在不同数据量下ETLCloud和Kettle表现更为稳定,而DataX在不同的数据量下波动范围更多,数据量越大时DataX的性能有逐步提升的趋势。

对于评测结果来说ETLCloud的性能之所以相对于其他ETL工具性要快最主要取决于ETLCloud研发团队不断对工具底层引擎和算法调优的结果,我们经过大量的项目PK和大数据量的考验对底层的数据读取和写入以及中间过程的序列化均进行了长时间的不断优化和测试,同时ETLCloud很好的在性能和功能方面取得了比较好的平衡策略,有些ETL工具虽然性能更快但是功能很弱只适用于某一种场景,而像Kettle虽然功能很强但在性能方面受制于项目的体积逐步降低了性能。ETLCloud在性能和功能方面都取得了非常好的成绩,这也是我们一直追求极致产品的结果。

以下是针对不同数据量下的传输性能评测的汇总数据:

image.png

image.png

直播评测实验中,参与测试的工具均安装于windows Server2019数据中心版操作系统的阿里云服务器,服务器配置8内核,32G内存以及100G数据盘,公网宽带5M,各个工具均配置相同的内存参数,有些ETL工具由于不支持Windows操作系统的安装没有纳入本次评测范围。

测试过程使用3款主流ETL工具测试2种不同的数据集成场景下,3种不同数据量传输的情况,包括数据库的查询、写入和存储。为了保证测试数据的真实性和公平性,所有测试流程都采用相同的配置和传输模式,同时为避免因目标数据库被重复清空和写入带来的性能影响,相同数据量下所有工具依次进行测试。

通过测评结果看出,ETLCloud在每个场景下测评速度居于首位,从平均值来看,ETLCloud平均比kettle快24.16%,比DataX快27.8%,可以说,ETLCloud是国内大数据量下传输速度最快的数据集成工具。

具体的测评实验过程,请点击下方链接观看:
主流ETL工具(ETLCloud、DataX、Kettle)数据传输性能大PK

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 启动完 kubelet 日志显示 failed to get azure cloud in GetVolumeLimits, plugin.host: 1
  • 2024辽宁省大学数学建模竞赛试题思路
  • 什么是面向对象编程
  • MVC 控制器 中Action 不能同名,参数不一样,路由器寻找不到对应的,要加特性
  • Python-PLAXIS自动化建模技术与典型岩土工程案例
  • 新版Android Studio中设置gradle的JDK版本
  • python:在同一视窗中画出三个函数的图形
  • Linux操作系统安全分析与防护
  • 如何为IP申请SSL证书
  • 存储照片有必要买硬盘吗?长期存照片用什么硬盘
  • MySQL零散拾遗
  • 【论文阅读笔记】ASPS: Augmented Segment Anything Model for Polyp Segmentation
  • 从零开始的python学习生活2
  • FullCalendar的使用,react日历组件
  • C++中的非类型模板参数丶模板特化和分离编译
  • [PHP内核探索]PHP中的哈希表
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • 2018以太坊智能合约编程语言solidity的最佳IDEs
  • Cookie 在前端中的实践
  • JAVA_NIO系列——Channel和Buffer详解
  • React 快速上手 - 06 容器组件、展示组件、操作组件
  • Redis中的lru算法实现
  • Shadow DOM 内部构造及如何构建独立组件
  • TCP拥塞控制
  • 基于Dubbo+ZooKeeper的分布式服务的实现
  • 坑!为什么View.startAnimation不起作用?
  • 力扣(LeetCode)965
  • 小试R空间处理新库sf
  • 学习ES6 变量的解构赋值
  • #java学习笔记(面向对象)----(未完结)
  • #php的pecl工具#
  • #在 README.md 中生成项目目录结构
  • (02)Unity使用在线AI大模型(调用Python)
  • (1)(1.13) SiK无线电高级配置(五)
  • (12)Hive调优——count distinct去重优化
  • (14)目标检测_SSD训练代码基于pytorch搭建代码
  • (多级缓存)多级缓存
  • (二开)Flink 修改源码拓展 SQL 语法
  • (更新)A股上市公司华证ESG评级得分稳健性校验ESG得分年均值中位数(2009-2023年.12)
  • (力扣)1314.矩阵区域和
  • (已解决)报错:Could not load the Qt platform plugin “xcb“
  • (转)h264中avc和flv数据的解析
  • **Java有哪些悲观锁的实现_乐观锁、悲观锁、Redis分布式锁和Zookeeper分布式锁的实现以及流程原理...
  • .halo勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET 依赖注入和配置系统
  • .NET 直连SAP HANA数据库
  • .NET/C# 将一个命令行参数字符串转换为命令行参数数组 args
  • .NET/C# 使用反射调用含 ref 或 out 参数的方法
  • /var/lib/dpkg/lock 锁定问题
  • ?php echo $logosrc[0];?,如何在一行中显示logo和标题?
  • [ element-ui:table ] 设置table中某些行数据禁止被选中,通过selectable 定义方法解决
  • [ vulhub漏洞复现篇 ] AppWeb认证绕过漏洞(CVE-2018-8715)
  • [AIGC] 如何建立和优化你的工作流?
  • [Android 13]Input系列--获取触摸窗口
  • [android] 练习PopupWindow实现对话框