当前位置: 首页 > news >正文

centos安装数据库同步工具sqoop并导入数据,导出数据,添加定时任务

目录

1.安装jdk

1.1上传jdk安装包到/opt目录下并解压

1.2解压

1.3配置环境变量

2.安装hadoop

2.1.下载hadoop

2.2.解压hadoop

2.3配置环境变量 

3.安装sqoop

3.1下载

3.2解压

3.3下载依赖包并复制到指定位置

3.3.1下载commons-lang-2.6-bin.tar.gz

3.3.2将mysql-connector-j-8.3.0.jar上传到sqoop的lib目录

3.4配置环境 

4.使用

4.1导出mysql数据到hadoop

4.2将hadoop数据导入到mysql

4.3创建任务


1.安装jdk

1.1上传jdk安装包到/opt目录下并解压

1.2解压

解压示例

cd /opt
tar -zxvf jdk-8u381-linux-x64.tar.gz

1.3配置环境变量

JAVA_HOME=/opt/jdk1.8.0_381
CLASSPATH=.:$JAVA_HOME/lib.tools.jar
PATH=$JAVA_HOME/bin:$PATH
export JAVA_HOME CLASSPATH PATH

2.安装hadoop

2.1.下载hadoop

cd /opt
wget https://note.youdao.com/s/F3hrTVve

2.2.解压hadoop

tar -xvf hadoop-2.8.5.tar.gz

2.3配置环境变量 

vim /etc/profile

增加如下内容

export HADOOP_COMMON_HOME=/opt/hadoop-2.8.5
export PATH=$HADOOP_COMMON_HOME/bin:$PATHexport HADOOP_MAPRED_HOME=/opt/hadoop-2.8.5
export PATH=$HADOOP_MAPRED_HOME/bin:$PATH

使环境生效

source /etc/profile

3.安装sqoop

3.1下载

cd /opt
wget https://archive.apache.org/dist/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

3.2解压

cd /opt
tar -xvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

3.3下载依赖包并复制到指定位置

3.3.1下载commons-lang-2.6-bin.tar.gz

cd /opt
wget https://mirrors.tuna.tsinghua.edu.cn/apache/commons/lang/binaries/commons-lang-2.6-bin.tar.gz

 解压后得到文件commons-lang-2.6.jar

tar -zxvf commons-lang-2.6-bin.tar.gz

将文件commons-lang-2.6.jar复制到sqoop的lib目录

cp /opt/commons-lang-2.6-bin/commons-lang-2.6/commons-lang-2.6.jar /opt/sqoop/lib

3.3.2将mysql-connector-j-8.3.0.jar上传到sqoop的lib目录

由于本地有mysql-connector-j-8.3.0.jar直接上传该jar到sqoop的lib目录

处理完示例

3.4配置环境 

vim /etc/profile

 增加如下内容

export SQOOP_HOME=/opt/sqoop
export CLASSPATH=$CLASSPASS:$SQOOP_HOME/lib
export PATH=$SQOOP_HOME/bin:$PATH

使环境生效

source /etc/profile

4.使用

4.1导出mysql数据到hadoop

将数据库mysql://192.168.168.76:3306/test表kq_check_detail 的数据导出到/opt/test2 

注意:/opt/test2 必须不存在


sqoop import \
--connect jdbc:mysql://192.168.168.76:3306/test \
--username test \
--password 123456 \
--target-dir /opt/test2 \
--query 'SELECT * FROM kq_check_detail WHERE id!=5 AND $CONDITIONS' \
--num-mappers 1 \
--bindir /opt/sqoop/lib

4.2将hadoop数据导入到mysql

 /opt/test2导入到数据库mysql://192.168.168.76:3306/test2的表kq_check_detail 中

sqoop export \
--connect jdbc:mysql://192.168.168.76:3306/test2 \
--driver com.mysql.jdbc.Driver \
--username test \
--password 123456 \
--table kq_check_detail \
--export-dir /opt/test2 \
-m 1 

4.3创建任务

sqoop job \--create test\-- import \--connect jdbc:mysql://192.168.168.76:3306/test \--table kq_check_detail \--username root \--password 123456 \--incremental append \--check-column update_time \--last-value '2024-07-10 00:00:00' \--target-dir /data/test/kq_check_detail \--m 3 

4.4执行任务

 sqoop job --exec test

4.5删除任务

sqoop job \--delete test \-- import \--connect jdbc:mysql://192.168.168.76:3306/test \--table kq_check_detail \--username test \--password 123456\--incremental append \--check-column update_time \--last-value '2024-07-10 00:00:00' \--target-dir /data/test/kq_check_detail \--m 3

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • java线程介绍
  • Sharding-JDBC分库分表之SpringBoot分片策略
  • 前端实现无缝自动滚动动画
  • 【leetcode刷题笔记】02.复写零
  • 华为HCIP Datacom H12-821 卷28
  • Postman使用教程【项目实战】
  • Java 8革新:现代编程的全新标准与挑战
  • 《梦醒蝶飞:释放Excel函数与公式的力量》10.4 IMREAL函数
  • C#字符串格式化的方式
  • nginx的正向代理和反向代理
  • 微软 Edge 浏览器全解析
  • Kylin系列(三)安装与配置:搭建你的第一个 Kylin 环境
  • 网络防御保护——网络安全概述
  • 第二周:李宏毅机器学习笔记
  • Android知识收集
  • angular2开源库收集
  • CODING 缺陷管理功能正式开始公测
  • eclipse的离线汉化
  • Java|序列化异常StreamCorruptedException的解决方法
  • JavaScript 奇技淫巧
  • JavaScript中的对象个人分享
  • Java超时控制的实现
  • JS变量作用域
  • nodejs实现webservice问题总结
  • oschina
  • Redis在Web项目中的应用与实践
  • tensorflow学习笔记3——MNIST应用篇
  • 成为一名优秀的Developer的书单
  • 二维平面内的碰撞检测【一】
  • 高程读书笔记 第六章 面向对象程序设计
  • 给github项目添加CI badge
  • 聊一聊前端的监控
  • 少走弯路,给Java 1~5 年程序员的建议
  • 思维导图—你不知道的JavaScript中卷
  • 通过npm或yarn自动生成vue组件
  • 一道闭包题引发的思考
  • hi-nginx-1.3.4编译安装
  • Nginx惊现漏洞 百万网站面临“拖库”风险
  • 摩拜创始人胡玮炜也彻底离开了,共享单车行业还有未来吗? ...
  • ​LeetCode解法汇总1276. 不浪费原料的汉堡制作方案
  • ​软考-高级-系统架构设计师教程(清华第2版)【第20章 系统架构设计师论文写作要点(P717~728)-思维导图】​
  • ​虚拟化系列介绍(十)
  • ### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException
  • #多叉树深度遍历_结合深度学习的视频编码方法--帧内预测
  • #我与Java虚拟机的故事#连载11: JVM学习之路
  • (12)Hive调优——count distinct去重优化
  • (12)目标检测_SSD基于pytorch搭建代码
  • (含react-draggable库以及相关BUG如何解决)固定在左上方某盒子内(如按钮)添加可拖动功能,使用react hook语法实现
  • (南京观海微电子)——I3C协议介绍
  • (求助)用傲游上csdn博客时标签栏和网址栏一直显示袁萌 的头像
  • (学习日记)2024.04.10:UCOSIII第三十八节:事件实验
  • *Algs4-1.5.25随机网格的倍率测试-(未读懂题)
  • .NET 分布式技术比较
  • .NET 直连SAP HANA数据库
  • .net分布式压力测试工具(Beetle.DT)