当前位置: 首页 > news >正文

seatunnel数据集成(一)简介与安装

seatunnel数据集成(一)简介与安装
seatunnel数据集成(二)数据同步
seatunnel数据集成(三)多表同步
seatunnel数据集成(四)连接器使用
 


1、背景

About Seatunnel | Apache SeaTunnel

  • SeaTunnel 是一个简单易用的数据集成框架。
  • SeaTunnel的前身是 Waterdrop(中文名:水滴)自 2021 年 10 月 12日更名为 SeaTunnel。
  • 2021 年 12 月 9 日,SeaTunnel 正式通过 Apache 软件基金会的投票决议,以全票通过的优秀表现正式成为 Apache 孵化器项目。
  • 2022 年 3 月 18 日社区正式发布了首个 Apache 版本v2.1.0。

2、 应用场景

  • 海量数据的同步
  • 海量数据的集成
  • 海量数据的ETL
  • 海量数据聚合
  • 多源数据处理

3、 特点

  • 基于配置的低代码开发,易用性高,方便维护。
  • 支持实时流式传输
  • 离线多源数据分析
  • 高性能、海量数据处理能力
  • 模块化的插件架构,易于扩展
  • 支持用SQL进行数据操作和数据聚合
  • 支持Sparkstructured streaming
  • 支持Spark 2.x

4、优势

  • 丰富的连接器
  • 批流一体、多种开发模式
  • 转换海量数据
  • 易管理维护

5、安装部署

下载解压

https://dlcdn.apache.org/incubator/SeaTunnel/2.3.1/apache-SeaTunnel-incubating-2.3.1-bin.tar.gz

下载完毕之后上传到服务器上面并解压

# 解压tar -zxvf apache-SeaTunnel-incubating-2.3.1-bin.tar.gz

下载对应的connector

在Apache的仓库下载相应的connector,下载时每个jar包在不同的路径下面,放到/SeaTunnel-2.3.1/connectors/SeaTunnel目录下

https://repo.maven.apache.org/maven2/org/apache/SeaTunnel/

配置安装SeaTunnel的插件

vim SeaTunnel-2.3.1/config/plugin_config

安装SeaTunnel

sh bin/install-plugin.sh 2.3.1

6、简单使用

bin目录下

install-plugin.sh                              --安装连接器脚本seatunnel-cluster.sh                           -–集群模式启动脚本seatunnel-cluster.sh                           --本地模式启动脚本start-seatunnel-flink-13-connector-v2.sh       –-flink1.12-1.14版本引擎启动脚本start-seatunnel-flink-15-connector-v2.sh       –-flink1.15-1.16版本引擎启动脚本start-seatunnel-spark-2-connector-v2.sh        –-saprk2.x版本引擎启动脚本start-seatunnel-spark-3-connector-v2.sh        –-saprk3.x版本引擎启动脚本stop-seatunnel-cluster.sh                      -–集群模式关闭脚本
  • 默认引擎seatunnel.sh。
  • 提交spark任务用start-seatunnel-spark.sh。
  • 提交flink任务则用start-seatunnel-flink.sh。

可以指定3个参数

分别是:

--config 应用配置的路径

--variable 应用配置里的变量赋值

--check 检查config语法是否合法

相关文章:

  • SpringCloud-Ribbon:负载均衡(基于客户端)
  • C#调用WechatOCR.exe实现本地OCR文字识别
  • Python基础篇_修饰符(Decorators)【上】
  • 深入探索 Express.js 的高级特性
  • SpringCloud-Eureka原理分析
  • RK3588平台开发系列讲解(Camera篇)使用v4l2-ctl抓图
  • 电力负荷预测 | 电力系统负荷预测模型(Python线性回归、随机森林、支持向量机、BP神经网络、GRU、LSTM)
  • CAN通讯协议详解
  • 基于Linux操作系统的Docker容器安装MySQL随笔
  • 微软.NET6开发的C#特性——委托和事件
  • vue基本语法总结大全
  • 【开源】JAVA+Vue.js实现高校实验室管理系统
  • Ubuntu 22 部署Zabbix 6.4
  • LeetCode、216. 组合总和 III【中等,组合型枚举】
  • Linux介绍和命令使用
  • 4个实用的微服务测试策略
  • ES6 ...操作符
  • Golang-长连接-状态推送
  • JavaScript/HTML5图表开发工具JavaScript Charts v3.19.6发布【附下载】
  • jquery cookie
  • JS数组方法汇总
  • Linux中的硬链接与软链接
  • Lsb图片隐写
  • Shadow DOM 内部构造及如何构建独立组件
  • VuePress 静态网站生成
  • 设计模式走一遍---观察者模式
  • 移动端解决方案学习记录
  • ​520就是要宠粉,你的心头书我买单
  • # Maven错误Error executing Maven
  • # 日期待t_最值得等的SUV奥迪Q9:空间比MPV还大,或搭4.0T,香
  • #!/usr/bin/python与#!/usr/bin/env python的区别
  • (1)(1.13) SiK无线电高级配置(五)
  • (27)4.8 习题课
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第5节(封闭类和Final方法)
  • (Java数据结构)ArrayList
  • (Pytorch框架)神经网络输出维度调试,做出我们自己的网络来!!(详细教程~)
  • (二)构建dubbo分布式平台-平台功能导图
  • (附源码)springboot建达集团公司平台 毕业设计 141538
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (没学懂,待填坑)【动态规划】数位动态规划
  • (篇九)MySQL常用内置函数
  • (一)认识微服务
  • (一)使用Mybatis实现在student数据库中插入一个学生信息
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • (转)http-server应用
  • (转)创业家杂志:UCWEB天使第一步
  • (转)德国人的记事本
  • (转)原始图像数据和PDF中的图像数据
  • (轉貼) VS2005 快捷键 (初級) (.NET) (Visual Studio)
  • . ./ bash dash source 这五种执行shell脚本方式 区别
  • .a文件和.so文件
  • .NET Core Web APi类库如何内嵌运行?
  • .net core使用ef 6
  • .net 程序 换成 java,NET程序员如何转行为J2EE之java基础上(9)
  • .NET/C# 使用 #if 和 Conditional 特性来按条件编译代码的不同原理和适用场景