当前位置: 首页 > news >正文

调度器——DolphinScheduler讲解及安装教程

调度器——DolphinScheduler讲解及安装教程

一:基本讲解

Dolphin Scheduler

1、开源的分布式任务调度系统
2、支持多种任务类型,包括Shell、Spark、Hive等
3、灵活的任务调度功能和友好的Web界面,方便管理和监控任务的执行情况

架构


操作系统版本要求

操作系统版本
Red Hat Enterprise Linux7.0 及以上
CentOS7.0 及以上
Oracle Enterprise Linux7.0 及以上
Ubuntu LTS16.04 及以上

硬件要求

CPU内存硬盘类型网络实例数量
4核+8 GB+SAS千兆网卡1+

二:安装教程

前期准备工作

  • jdk 1.8+
  • mysql 5+
  • zookeeper 3.4.6+
  • hadoop 2.6+
  • psmisc yum -y install psmisc

解压安装包

# 将安装包apache-dolphinscheduler-2.0.8-bin.tar.gz放置/opt/download目录下
# 解压缩
tar -zxvf apache-dolphinscheduler-2.0.8-bin.tar.gz -C /opt/software

重命名

mv apache-dolphinscheduler-2.0.8-bin/ dolphinscheduler-2.0.8

配置一键部署脚本

vim conf/config/install_config.conf 
ips="single" 
# 将要部署任一 DolphinScheduler 服务的服务器主机名或 ip 列表sshPort="22"masters="single" 
# master 所在主机名列表,必须是 ips 的子集workers="single:default" 
# worker 主机名及队列,此处的 ip 必须在 ips 列表中alertServer="single"
# 告警服务所在服务器主机名apiServerPort="12345"
apiServers="single"
# api服务所在服务器主机名installPath="/opt/software/dolphinscheduler-2.0.8-install/install"
# DS 安装路径,如果不存在会创建deployUser="root"
# 部署用户dataBasedirPath="/opt/software/dolphinscheduler-2.0.8-install/data"
# 前文配置的所有节点的本地数据存储路径,需要确保部署用户拥有该【目录】的读写权限javaHome="/opt/software/jdk1.8.0_171"
# JAVA_HOME 路径DATABASE_TYPE="mysql"
# 数据库类型SPRING_DATASOURCE_URL="jdbc:mysql://single:3306/dolphinscheduler?createDatabaseIfNotExist=true&useUnicode=true&characterEncoding=UTF-8"
# 数据库 URLSPRING_DATASOURCE_USERNAME="用户名"
# 数据库用户名,有远程访问权限(远程连接)SPRING_DATASOURCE_PASSWORD="密码"
# 数据库密码(远程连接)registryPluginName="zookeeper"
# 注册中心插件名称,DS 通过注册中心来确保集群配置的一致性
registryServers="single:2181"
# 注册中心地址,即 Zookeeper 集群的地址
registryNamespace="dolphinscheduler"
# DS 在 Zookeeper 的结点名称# ---------------------------------------------------------
# Worker Task Server
# ---------------------------------------------------------
taskPluginDir="lib/plugin/task"resourceStorageType="HDFS"  
# 资源存储类型
resourceUploadPath="/dolphinscheduler"
# 资源上传路径,请确保该路径在HDFS已创建
defaultFS="hdfs://single:9000"
# 默认文件系统,此处为单机,集群默认端口为8020# if resourceStorageType is S3, the following three configuration is required, otherwise please ignore
s3Endpoint="http://192.168.xx.xx:9010"
s3AccessKey="xxxxxxxxxx"
s3SecretKey="xxxxxxxxxx"# resourcemanager port, the default value is 8088 if not specified
resourceManagerHttpAddressPort="8088"
# yarn RM http 访问端口# if resourcemanager HA is enabled, please set the HA IPs; if resourcemanager is single node, keep this value empty
yarnHaIps=
# Yarn RM 高可用 ip,若未启用 RM 高可用,则将该值置空# if resourcemanager HA is enabled or not use resourcemanager, please keep the default value; If resourcemanager is single node, you only need to replace 'yarnIp1' to actual resourcemanager hostname
singleYarnIp="single"
# Yarn RM 主机名,若启用了 HA 或未启用 RM,保留默认值# who has permission to create directory under HDFS/S3 root path
# Note: if kerberos is enabled, please config hdfsRootUser=
hdfsRootUser="root"
# 拥有 HDFS 根目录操作权限的用户# kerberos config
# whether kerberos starts, if kerberos starts, following four items need to config, otherwise please ignore
kerberosStartUp="false"
# kdc krb5 config file path
krb5ConfPath="$installPath/conf/krb5.conf"
# keytab username,watch out the @ sign should followd by \\
keytabUserName="hdfs-mycluster\\@ESZ.COM"
# username keytab path
keytabPath="$installPath/conf/hdfs.headless.keytab"
# kerberos expire time, the unit is hour
kerberosExpireTime="2"
# kerberos认证,防止恶意用户伪装成其他用户侵入集群或提交作业# use sudo or not
sudoEnable="true"# worker tenant auto create
workerTenantAutoCreate="false"

初始化数据库

因 SPRING_DATASOURCE_URL 配置中追加 createDatabaseIfNotExist=true,所以无需手动建库

拷贝MySQL驱动
cp /opt/download/mysql-connector-j-8.0.33.jar /opt/software/dolphinscheduler-2.0.8/lib
执行数据库初始化脚本
/opt/software/dolphinscheduler-2.0.8/script/create-dolphinscheduler.sh

一键部署

启动ZK后一键部署并启动
# 启动zookeeper
zkServer.sh start
# 启动dolphinscheduler
/opt/software/dolphinscheduler-2.0.8/install.sh
查看进程
# 单机
3668 QuorumPeerMain
4614 AlertServer
4520 WorkerServer
4662 ApiApplicationServer
4567 LoggerServer
4473 MasterServer
访问 Web UI

http://single:12345/dolphinscheduler

初始用户:admin
初始密码:dolphinscheduler123

一键开关命令
/opt/software/dolphinscheduler-2.0.8/bin/start-all.sh
/opt/software/dolphinscheduler-2.0.8/bin/stop-all.sh

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【C++进阶学习】第九弹——哈希的原理与实现——开放寻址法的讲解
  • 测试开发面试题---计算机网络
  • 减轻幻觉新SOTA,7B模型自迭代训练效果超越GPT-4,上海AI lab发布
  • AutoSAR自适应平台架构总览--AP的初认识
  • Python入门第二课
  • 【专题】百度萝卜快跑体验:Robotaxi发展现状与展望报告合集PDF分享(附原数据表)
  • 【CSS】继承属性
  • 【图像标签转换】XML转为TXT图像数据集标签
  • 如何预防网站爬虫攻击
  • SQL39道常见题型
  • 【微信小程序实战教程】之微信小程序原生开发详解
  • el-date-picker 时间控件校验选择时间必须早于当前时间(带时分秒)
  • CSS常见属性详解——内边距与外边距
  • 今日份感悟
  • 智慧工地视频汇聚管理平台:打造现代化工程管理的全新视界
  • Angular Elements 及其运作原理
  • eclipse(luna)创建web工程
  • Laravel 中的一个后期静态绑定
  • SpringBoot 实战 (三) | 配置文件详解
  • Tornado学习笔记(1)
  • 读懂package.json -- 依赖管理
  • 记一次删除Git记录中的大文件的过程
  • 目录与文件属性:编写ls
  • 如何打造100亿SDK累计覆盖量的大数据系统
  • 如何将自己的网站分享到QQ空间,微信,微博等等
  • 使用阿里云发布分布式网站,开发时候应该注意什么?
  • 云栖大讲堂Java基础入门(三)- 阿里巴巴Java开发手册介绍
  • 阿里云ACE认证学习知识点梳理
  • 哈罗单车融资几十亿元,蚂蚁金服与春华资本加持 ...
  • 专访Pony.ai 楼天城:自动驾驶已经走过了“从0到1”,“规模”是行业的分水岭| 自动驾驶这十年 ...
  • ​【C语言】长篇详解,字符系列篇3-----strstr,strtok,strerror字符串函数的使用【图文详解​】
  • #define 用法
  • $NOIp2018$劝退记
  • (16)Reactor的测试——响应式Spring的道法术器
  • (2009.11版)《网络管理员考试 考前冲刺预测卷及考点解析》复习重点
  • (C++)八皇后问题
  • (C语言)二分查找 超详细
  • (day6) 319. 灯泡开关
  • (Redis使用系列) Springboot 使用redis实现接口幂等性拦截 十一
  • (阿里巴巴 dubbo,有数据库,可执行 )dubbo zookeeper spring demo
  • (附源码)springboot太原学院贫困生申请管理系统 毕业设计 101517
  • (回溯) LeetCode 40. 组合总和II
  • (四)Tiki-taka算法(TTA)求解无人机三维路径规划研究(MATLAB)
  • (转)Mysql的优化设置
  • (转载)深入super,看Python如何解决钻石继承难题
  • (轉貼) 蒼井そら挑戰筋肉擂台 (Misc)
  • .\OBJ\test1.axf: Error: L6230W: Ignoring --entry command. Cannot find argumen 'Reset_Handler'
  • .locked1、locked勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET C# 使用 iText 生成PDF
  • .NET WebClient 类下载部分文件会错误?可能是解压缩的锅
  • .NET 常见的偏门问题
  • .NET 同步与异步 之 原子操作和自旋锁(Interlocked、SpinLock)(九)
  • /proc/interrupts 和 /proc/stat 查看中断的情况
  • @EnableWebMvc介绍和使用详细demo
  • @ModelAttribute 注解