当前位置: 首页 > news >正文

sqoop在Linux中环境搭建,sqoop搭建和运行小结

一. 安装工具和操作系统:

macOs 4核8G  brew 安装 postgresql

二. 安装sqoop

brew install sqoop

会自动安装hadoop hbase hive zookeeper sqoop

三. 启动

brew services start habse

brew services start zookeeper

四. 安装hadoop(先看注意事项,修改响应的配置文件然后再启动hadoop)

参考链接: http://zhongyaonan.com/hadoop-tutorial/setting-up-hadoop-2-6-on-mac-osx-yosemite.html

注意: 我目前brew 安装的最新版本是:hadoop 3.0.0

1. 默认安装目录/usr/local/Cellar/hadoop/3.0.0/libexec

cd /usr/local/Cellar/hadoop/3.0.0/libexec

cd etc/hadoop/ 里面放置的是配置文件

教程里面 hadoop-env.sh不用配置

2. 修改配置文件:

vim yarn-site.xml

如果按照教程里面配置会出现错误:找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

按照这个参考链接找到了答案:http://wenda.chinahadoop.cn/question/3069

需要再加入一个配置项:name:yarn.application.classpath

对应的值 value为执行hadoop classpath输出的结果

例如我的配置:注意版本和目录有可能不同,按照具体的输出修改

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.application.classpath

/usr/local/Cellar/hadoop/3.0.0/libexec/etc/hadoop:/usr/local/Cellar/hadoop/3.0.0/libexec/share/hadoop/common/lib/*:/usr/local/Cellar/hadoop/3.0.0/libexec/share/hadoop/common/*:/usr/local/Cellar/hadoop/3.0.0/libexec/share/ hadoop/hdfs:/usr/local/Cellar/hadoop/3.0.0/libexec/share/hadoop/hdfs/lib/*:/usr/local/Cellar/hadoop/3.0.0/libexec/share/hadoop/hdfs/*:/usr/local/Cellar/hadoop/3.0.0/libexec/share/hadoop/mapreduce/*:/usr/local/Cellar/hadoop/3.0.0/libexec/ share/hadoop/yarn:/usr/local/Cellar/hadoop/3.0.0/libexec/share/hadoop/yarn/lib/*:/usr/local/Cellar/hadoop/3.0.0/libexec/share/hadoop/yarn/*

3. 启动和重启

建议:每次删除掉/tmp/hadoop*

1. rm -rf /tmp/hadoop*

2. bin/hdfs namenode -format

每次重启或者首次启动都要执行,否则datanode可能无法启动

sbin/start-dfs.sh 启动dfs

sbin/start-yarn.sh

启动完成检验输入jps 获得如下输出表示没有问题,否则要检查各个步骤和报错,直到启动完毕,方可继续进行

5efba85c45e38d96327b90ac110b5000.png

五. 配置sqoop

1. 配置sqoop的环境变量(这一步灰常重要,官方文档里面貌似没有详细说明,我也是根据报错摸索的)

默认安装位置是:

cd /usr/local/Cellar/sqoop/1.4.6/libexec

vim conf/sqoop-env.sh

添加如下配置:根据具体版本和安装目录做调整

export JAVA_HOME="/Library/Java/JavaVirtualMachines/jdk1.8.0_92.jdk/Contents/Home"

export HADOOP_HOME="/usr/local/Cellar/hadoop/3.0.0/libexec"

export HBASE_HOME="/usr/local/Cellar/hbase/1.2.6"

export HIVE_HOME="usr/local/Cellar/hive/2.3.1"

export ZOOCFGDIR="/usr/local/etc/zookeeper"

五. 测试

brew 默认把sqoop添加进入环境变量的

输入:sqoop version 会出现sqoop的版本号,warning里面一些组建的环境变量没有配置,暂时用不到不用管

b1cce857cf00bf344402987b17dae37a.png

6. 导出( 从hdfs导出到postgresql)

(1)先上传一个文件到hdfs

vim student.txt

内容如下:

1,Ace

2,zeus

3,tom

4,john

hadoop fs -put student.txt /user/test

/user/test目录是我搭建hadoop之后在hdfs上创建的目录

上传之后查看一下:hadoop fs -ls -R /user/test

(2)创建表这里使用的是postgresql数据库

07e768f7b0b7ba749ff65d78fd9697af.png

(3) 下载jdbc的jar包

我使用的是postgresql所以下载postgresql的jar包,大家可以根据响应的数据库类型下载相应的jdbc包

下载地址:https://jdbc.postgresql.org/download/postgresql-9.3-1101.jdbc41.jar

移动到/usr/local/Cellar/sqoop/1.4.6/libexec/lib目录下。根据版本修改路径

(4)运行

sqoop export --connect jdbc:postgresql://localhost:5432/test --username test --password newpass --table stud1 -m 1 --export-dir /user/test/student.txt

数据库密码别忘了修改

(5)结果

de3a6f8acf165a16ed014c1c4248a195.png

(6)查看结果

a3445b3e514eee8dcd0cba4eab2c5287.png

7. 导入从postgresql到hbase

sqoop import --connect jdbc:postgresql://localhost:5432/test --username test --password newpass --table stud1 -m 1

37b037d193eb642e7ce307ea47b4c535.png

至此poc完毕

相关文章:

  • linux版的微博客户端,Ubuntu Linux 新浪微博客户端
  • linux下数学公式的编辑器,Linux下的公式编辑器——libreoffice math 使用快速入门
  • 三个数取大 c语言程序,C程序查找三个数字中最大的数字
  • 循环n个字符c语言,while( getchar() != ''\n) continue;这个循环读怎么取首字符
  • c语言数据类型l77,C语言练习题1(分支、循环)1v1.3完整版.docx
  • 能正确表达C语言表达式,能正确表达逻辑关系:a≥10 或a≤0的C语言表达式是 。...
  • linux date(),linux命令-date(??)
  • android 底部tab实现,安卓开发 底部tab的实现
  • android种listview使用方法,Android中ListView用法实例分析
  • android 打印机 sdk,通过WIFI使用Brother SDK进行Android打印(ERROR_WR...
  • synchronized android,GitHub - qn5566/Synchronized: Android同步列講解
  • android app应用豁免,android studio ..在代码中没有错误,但有豁免
  • android 检测app存在,Android APP存活检测
  • 行转换html,HTML连载30-CSS显示模式amp;模式转换
  • html资源文件记载进度条,html5 文件上传 带进度条
  • 【剑指offer】让抽象问题具体化
  • 〔开发系列〕一次关于小程序开发的深度总结
  • Android框架之Volley
  • Eureka 2.0 开源流产,真的对你影响很大吗?
  • Hibernate最全面试题
  • Java 最常见的 200+ 面试题:面试必备
  • ReactNative开发常用的三方模块
  • React-生命周期杂记
  • windows下mongoDB的环境配置
  • 爱情 北京女病人
  • 基于Android乐音识别(2)
  • 深入 Nginx 之配置篇
  • 文本多行溢出显示...之最后一行不到行尾的解决
  • 小程序 setData 学问多
  • 小程序01:wepy框架整合iview webapp UI
  • Mac 上flink的安装与启动
  • 京东物流联手山西图灵打造智能供应链,让阅读更有趣 ...
  • #etcd#安装时出错
  • (3)(3.5) 遥测无线电区域条例
  • (保姆级教程)Mysql中索引、触发器、存储过程、存储函数的概念、作用,以及如何使用索引、存储过程,代码操作演示
  • (附源码)php投票系统 毕业设计 121500
  • (附源码)springboot家庭财务分析系统 毕业设计641323
  • (算法)N皇后问题
  • (转)nsfocus-绿盟科技笔试题目
  • .class文件转换.java_从一个class文件深入理解Java字节码结构
  • .mysql secret在哪_MySQL如何使用索引
  • .net Signalr 使用笔记
  • .NET 设计模式—适配器模式(Adapter Pattern)
  • .w文件怎么转成html文件,使用pandoc进行Word与Markdown文件转化
  • ::
  • ??eclipse的安装配置问题!??
  • [1127]图形打印 sdutOJ
  • [23] GaussianAvatars: Photorealistic Head Avatars with Rigged 3D Gaussians
  • [C#C++]类CLASS
  • [CQOI 2011]动态逆序对
  • [Docker]十.Docker Swarm讲解
  • [EFI]Dell Latitude-7400电脑 Hackintosh 黑苹果efi引导文件
  • [FFmpeg学习]从视频中获取图片
  • [Flutter] extends、implements、mixin和 abstract、extension的使用介绍说明
  • [Foreman]解决Unable to find internal system admin account