当前位置: 首页 > news >正文

Hadoop的hdfs api操作

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

public static void listFile(String path) throws IOException{
		//读取配置文件
		Configuration conf = new Configuration();
		//获取文件系统
		FileSystem fs = FileSystem.get(URI.create("hdfs://hadoop1:9000"),conf);
		//获取文件或目录状态
		FileStatus[] fileStatus = fs.listStatus(new Path(path));
		//打印文件的路径
		for (FileStatus file : fileStatus) {
			System.out.println(file.getPath());
		}
	 
		//关闭文件系统
		fs.close();
	 }

一、包依赖

<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-client</artifactId>
    <version>2.7.6</version>
</dependency>

二、API的操作

1.创建目录

	public static void mkdir(String path) throws IOException {
		Configuration conf = new Configuration();
		conf.set("fs.defaultFS", "hdfs://127.0.0.1:9000");
		FileSystem fs = FileSystem.get(conf);
		Path srcPath = new Path(path);
		boolean isok = fs.mkdirs(srcPath);
		if (isok) {
			System.out.println("create dir ok!");
		} else {
			System.out.println("create dir failure");
		}
		fs.close();
	}

2.删除目录

/**
	 * 删除目录
	 * @param path
	 */
	public static void rmdir(String path)throws Exception {
		Configuration configuration = new Configuration();
		FileSystem fs = FileSystem.get(URI.create("hdfs://127.0.0.1:9000"), configuration);
	    boolean flag = fs.deleteOnExit(new Path("/test"));
	    if(flag) {
			 System.out.println("delete ok!");
		}else {
			 System.out.println("delete failure");
		}
		
		//关闭文件系统
		fs.close();

	}

3.创建文件

public static void createFile(String dst , byte[] contents) throws IOException{
		Configuration conf = new Configuration();
		FileSystem fs = FileSystem.get(URI.create("hdfs://localhost:9000"),conf);
		Path dstPath = new Path(dst);  
		FSDataOutputStream outputStream = fs.create(dstPath);
		outputStream.write(contents);
		outputStream.close();
		fs.close();
		System.out.println("文件创建成功!");
		
	 }

4.读取文件内容

public static void readFile(String uri) throws IOException {
		//读取配置文件
		Configuration conf = new Configuration();
		//获取文件系统
		FileSystem fs = FileSystem.get(URI.create("hdfs://localhost:9000"),conf);
		
		InputStream in = null;
		try {
			in = fs.open(new Path(uri));
			//复制到标准输出流
			IOUtils.copyBytes(in, System.out, 4096,false);
		} catch (Exception e) {
			e.printStackTrace();
		}finally{
			IOUtils.closeStream(in);
		}
	}

5.查看文件目录

public static void listFile(String path) throws IOException{
		//读取配置文件
		Configuration conf = new Configuration();
		//获取文件系统
		FileSystem fs = FileSystem.get(URI.create("hdfs://hadoop1:9000"),conf);
		//获取文件或目录状态
		FileStatus[] fileStatus = fs.listStatus(new Path(path));
		//打印文件的路径
		for (FileStatus file : fileStatus) {
			System.out.println(file.getPath());
		}
	 
		//关闭文件系统
		fs.close();
	 }

其它操作查看应的FileSystem的api

转载于:https://my.oschina.net/u/136848/blog/1924081

相关文章:

  • 反射获取枚举的属性注释
  • 各种卷积结构原理及优劣总结
  • linux 程序管理
  • mysql 索引使用教程
  • C#操作MongoDB
  • 分页器(自定制)
  • [转]Linux下防止进程使用swap及防止OOM机制导致进程被kill掉
  • springMVC集成activiti-explorer5.22(一)
  • freebsd为网卡设置别名
  • KVM命令集管理虚拟机
  • ORA-38301:can not perform DDL/DML Over Object in Recycle Bin 11.2.0.4
  • 实验:CentOS下构建私有CA
  • startActivityForResult()的用法(超好用啊)
  • [MongoDB]------windos下的安装部署与基础使用
  • JS小技巧
  • 3.7、@ResponseBody 和 @RestController
  • CentOS7 安装JDK
  • EOS是什么
  • es6--symbol
  • es的写入过程
  • Javascript 原型链
  • LeetCode刷题——29. Divide Two Integers(Part 1靠自己)
  • MYSQL 的 IF 函数
  • 开源地图数据可视化库——mapnik
  • 普通函数和构造函数的区别
  • 前端技术周刊 2018-12-10:前端自动化测试
  • 微信小程序上拉加载:onReachBottom详解+设置触发距离
  • 哈罗单车融资几十亿元,蚂蚁金服与春华资本加持 ...
  • ​卜东波研究员:高观点下的少儿计算思维
  • ​软考-高级-系统架构设计师教程(清华第2版)【第1章-绪论-思维导图】​
  • ​香农与信息论三大定律
  • #include到底该写在哪
  • #基础#使用Jupyter进行Notebook的转换 .ipynb文件导出为.md文件
  • (13)Hive调优——动态分区导致的小文件问题
  • (1综述)从零开始的嵌入式图像图像处理(PI+QT+OpenCV)实战演练
  • (20)目标检测算法之YOLOv5计算预选框、详解anchor计算
  • (python)数据结构---字典
  • (更新)A股上市公司华证ESG评级得分稳健性校验ESG得分年均值中位数(2009-2023年.12)
  • (机器学习-深度学习快速入门)第三章机器学习-第二节:机器学习模型之线性回归
  • (三) prometheus + grafana + alertmanager 配置Redis监控
  • (四)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (一)Mocha源码阅读: 项目结构及命令行启动
  • (转)拼包函数及网络封包的异常处理(含代码)
  • .NET处理HTTP请求
  • .Net多线程总结
  • [ vulhub漏洞复现篇 ] JBOSS AS 5.x/6.x反序列化远程代码执行漏洞CVE-2017-12149
  • [ 云计算 | AWS 实践 ] Java 如何重命名 Amazon S3 中的文件和文件夹
  • [20170705]lsnrctl status LISTENER_SCAN1
  • [Android] Amazon 的 android 音视频开发文档
  • [ArcPy百科]第三节: Geometry信息中的空间参考解析
  • [BT]BUUCTF刷题第9天(3.27)
  • [Codeforces1137D]Cooperative Game
  • [codevs 1515]跳 【解题报告】
  • [hdu 2896] 病毒侵袭 [ac自动机][病毒特征码匹配]
  • [JavaScript]_[初级]_[不使用JQuery原生Ajax提交表单文件并监听进度]