当前位置: 首页 > news >正文

HDFS学习之FileSystem

本地访问HDFS最主要的方式是使用HDFS提供的Java API,其他的访问方式也均是建立在这些API之上的。

Hadoop2.6.4API文档:http://hadoop.apache.org/docs/r2.6.4/api/index.html

HdfsDao中的方法:

(1). 文件上传、下载;

(2). 创建文件、文件夹;

(3). 删除文件、文件夹;

(4). 重命名文件或文件夹;

(5). 列出目录下的文件;

import java.io.BufferedInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
/**
 *  HDFS JavaAPI uses
 * @author baalhuo
 *
 */
public class HdfsDao {
	private Configuration conf =null;
	public HdfsDao(){
		conf =new Configuration();
		conf.addResource(new Path("/hadoop/etc/hadoop/core-site.xml"));
	}
	public HdfsDao(Configuration conf){
		this.conf =conf;
	}	
	public static void main(String[] args) throws IOException {
		HdfsDao hdfsDao = new HdfsDao();
		hdfsDao.lsFile("/user/root/");
	}	
	/*Upload file to HDFS*/
	public boolean  uploadFile(String path,String localfile){
		File file=new File(localfile);
		if (!file.isFile()) {
			System.out.println(file.getName());
			return false;
		}
		try {			
			FileSystem fs =FileSystem.get(conf);
			InputStream in = new BufferedInputStream(new FileInputStream(localfile));
			OutputStream out = fs.create(new Path(path+"/"+file.getName()));
			IOUtils.copyBytes(in, out, 4096, true);
			return true;
		} catch (IOException e) {
			e.printStackTrace();
		}
		return false;
	}
	/* Download file from HDFS */
	public boolean downloadFile(String hadfile,String localPath){
		try {
			FileSystem fs =FileSystem.get(conf);
			fs.copyToLocalFile(new Path(hadfile), new Path(localPath));
			return true;
		} catch (IOException e) {
			e.printStackTrace();
		}
		return false;
	}
	/*Create a folder*/
	public void mkdirFolder(String folder) throws IOException {
        Path path = new Path(folder);
        FileSystem fs = FileSystem.get(conf);
        if (!fs.exists(path)) {
            fs.mkdirs(path);
            System.out.println("Create: " + folder);
        }
        fs.close();
    }
    /* create a file by content */
    public void createFile(String file, String content) throws IOException {
        FileSystem fs = FileSystem.get(conf);
        byte[] buff = content.getBytes();
        FSDataOutputStream os = null;
        try {
            os = fs.create(new Path(file));
            os.write(buff, 0, buff.length);
            System.out.println("Create: " + file);
        } finally {
            if (os != null)
                os.close();
        }
        fs.close();
    }
	/* Delete file from HDFS */
	public boolean deleteFile(String hadfile){
		try {
			FileSystem hadoopFS =FileSystem.get(conf);
			Path hadPath=new Path(hadfile);
			Path p=hadPath.getParent();
			boolean rtnval= hadoopFS.delete(hadPath, true);
			FileStatus[] hadfiles= hadoopFS.listStatus(p);
			for(FileStatus fs :hadfiles){
				System.out.println(fs.toString());
			}
			return rtnval;
		} catch (IOException e) {
			e.printStackTrace();
		}
		return false;
	}
	/* Delete a folder */
    public void deleteFolder(String folder) throws IOException {
        Path path = new Path(folder);
        FileSystem fs = FileSystem.get(conf);
        fs.deleteOnExit(path);
        System.out.println("Delete: " + folder);
        fs.close();
    }
	/* Rename a file of HDFS */
	public void renameFile(String src, String dst) throws IOException {
        Path name1 = new Path(src);
        Path name2 = new Path(dst);
        FileSystem fs = FileSystem.get(conf);
        fs.rename(name1, name2);
        System.out.println("Rename from " + src + " to " + dst);
        fs.close();
    }
	/* Show file list */
	public void lsFile(String folder) throws IOException {
        Path path = new Path(folder);
        FileSystem fs = FileSystem.get(conf);
        FileStatus[] list = fs.listStatus(path);
        System.out.println("---ls: " + folder);
        if(list.length>0){
        	  for (FileStatus f : list) {
                  System.out.printf("Path: %s, idFile: %s, Size: %d\n", f.getPath(), f.isFile(), f.getLen());
                  if(!f.isFile()){
                  	String temppath = f.getPath().toString();
                  	String[] tempfolder = temppath.split("9000");
                  	lsFile(tempfolder[1]);
                  }
              }
        }
        fs.close();
    }
}


转载于:https://www.cnblogs.com/baalhuo/p/5762102.html

相关文章:

  • DDD实践问题之 - 关于论坛的帖子回复统计信息的更新的思考
  • HDU1230 火星A+B【进制】
  • tomcat下server.xml配置详解
  • BZOJ 2599 Race(树分治)
  • BI报表帮你轻松自如完成数据分析、业务数据探查
  • 第二次冲刺第二天
  • LintCode_389 判断数独是否合法
  • Android开发常见错误及技巧
  • 使用Markdown写文档
  • 普通pc安装懒人版的mac 10.10系统安装
  • mybatis-generator 基类继承
  • Spring MVC学习总结(5)——SpringMVC项目关于安全的一些配置与实现方式
  • 神奇的Android Studio Template
  • 微信端页面使用-webkit-box和绝对定位时,元素上移的问题
  • mysqldump 数据库备份
  • 【许晓笛】 EOS 智能合约案例解析(3)
  • Android框架之Volley
  • extract-text-webpack-plugin用法
  • JavaScript设计模式之工厂模式
  • leetcode讲解--894. All Possible Full Binary Trees
  • maya建模与骨骼动画快速实现人工鱼
  • python学习笔记 - ThreadLocal
  • 安卓应用性能调试和优化经验分享
  • 等保2.0 | 几维安全发布等保检测、等保加固专版 加速企业等保合规
  • 给初学者:JavaScript 中数组操作注意点
  • 基于组件的设计工作流与界面抽象
  • 开发基于以太坊智能合约的DApp
  • 什么是Javascript函数节流?
  • 使用 @font-face
  • 怎样选择前端框架
  • zabbix3.2监控linux磁盘IO
  • 仓管云——企业云erp功能有哪些?
  • 带你开发类似Pokemon Go的AR游戏
  • 函数计算新功能-----支持C#函数
  • ​​快速排序(四)——挖坑法,前后指针法与非递归
  • #我与Java虚拟机的故事#连载07:我放弃了对JVM的进一步学习
  • (C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示
  • (C++)栈的链式存储结构(出栈、入栈、判空、遍历、销毁)(数据结构与算法)
  • (C语言)二分查找 超详细
  • (安卓)跳转应用市场APP详情页的方式
  • (第二周)效能测试
  • (附源码)spring boot校园拼车微信小程序 毕业设计 091617
  • (含react-draggable库以及相关BUG如何解决)固定在左上方某盒子内(如按钮)添加可拖动功能,使用react hook语法实现
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (强烈推荐)移动端音视频从零到上手(上)
  • (十六)Flask之蓝图
  • (十六)串口UART
  • (四)【Jmeter】 JMeter的界面布局与组件概述
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • (转)iOS字体
  • (转)关于如何学好游戏3D引擎编程的一些经验
  • ****** 二 ******、软设笔记【数据结构】-KMP算法、树、二叉树
  • .【机器学习】隐马尔可夫模型(Hidden Markov Model,HMM)
  • .bat批处理(八):各种形式的变量%0、%i、%%i、var、%var%、!var!的含义和区别
  • .gitignore文件_Git:.gitignore