当前位置: 首页 > news >正文

大数据学习(2)HDFS文件管理

 命令行管理HDFS

 

[root@server1 bin]# hadoop fs 
Usage: hadoop fs [generic options]
        [-appendToFile <localsrc> ... <dst>]
        [-cat [-ignoreCrc] <src> ...]
        [-checksum <src> ...]
        [-chgrp [-R] GROUP PATH...]
        [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
        [-chown [-R] [OWNER][:[GROUP]] PATH...]
        [-copyFromLocal [-f] [-p] [-l] <localsrc> ... <dst>]
        [-copyToLocal [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-count [-q] [-h] <path> ...]
        [-cp [-f] [-p | -p[topax]] <src> ... <dst>]
        [-createSnapshot <snapshotDir> [<snapshotName>]]
        [-deleteSnapshot <snapshotDir> <snapshotName>]
        [-df [-h] [<path> ...]]
        [-du [-s] [-h] <path> ...]
        [-expunge]
        [-get [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-getfacl [-R] <path>]
        [-getfattr [-R] {-n name | -d} [-e en] <path>]
        [-getmerge [-nl] <src> <localdst>]
        [-help [cmd ...]]
        [-ls [-d] [-h] [-R] [<path> ...]]
        [-mkdir [-p] <path> ...]
        [-moveFromLocal <localsrc> ... <dst>]
        [-moveToLocal <src> <localdst>]
        [-mv <src> ... <dst>]
        [-put [-f] [-p] [-l] <localsrc> ... <dst>]
        [-renameSnapshot <snapshotDir> <oldName> <newName>]
        [-rm [-f] [-r|-R] [-skipTrash] <src> ...]
        [-rmdir [--ignore-fail-on-non-empty] <dir> ...]
        [-setfacl [-R] [{-b|-k} {-m|-x <acl_spec>} <path>]|[--set <acl_spec> <path>]]
        [-setfattr {-n name [-v value] | -x name} <path>]
        [-setrep [-R] [-w] <rep> <path> ...]
        [-stat [format] <path> ...]
        [-tail [-f] <file>]
        [-test -[defsz] <path>]
        [-text [-ignoreCrc] <src> ...]
        [-touchz <path> ...]
        [-usage [cmd ...]]

 

JAVA操作HDFS

maven依赖:

  <dependency>
        <groupId>jdk.tools</groupId>
        <artifactId>jdk.tools</artifactId>
        <version>1.6</version>
        <scope>system</scope>
        <systemPath>${JAVA_HOME}/lib/tools.jar</systemPath>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-hdfs</artifactId>
        <version>2.6.5</version>
    </dependency>
        
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-common</artifactId>
        <version>2.6.5</version>
    </dependency>

 

 上传&下载示例:

    public static void upload() throws Exception {
         Configuration conf = new Configuration();
         FileSystem fileSystem = FileSystem.get(new URI("hdfs://192.168.1.110:9000"),conf,"root");
         fileSystem.copyFromLocalFile(new Path("D:\\test\\2.txt"), new Path("/2.txt"));
         fileSystem.close();
    }
    public static void download() throws Exception {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "hdfs://192.168.1.110:9000");
        FileSystem fileSystem = FileSystem.get(conf);
        fileSystem.copyToLocalFile(false,new Path("/2.txt"),new Path("D:\\test\\2.download.txt"),true);
        fileSystem.close();
    }

 


 

参考:

HDFS文件管理:http://hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-hdfs/HDFSCommands.html

API文档:https://hadoop.apache.org/docs/r2.8.2/api/index.html

 

转载于:https://www.cnblogs.com/at0x7c00/p/8045357.html

相关文章:

  • Mac 10.12安装截图工具Jietu
  • Centos 搭建Mysql-Proxy 读写分离
  • 【小白学云计算】10分钟搭建一台web服务器!(就是快!)
  • [docker]docker网络-直接路由模式
  • SQL 简介
  • Jenkins 集成 Sonar
  • 初识HTTP
  • jfinal-admin 后台框架永久开源
  • 数据库索引实例之二consistent gets
  • Windows下搭建Redis集群
  • iOS系列开发-版本控制工具Git的使用
  • workSpace中多个工程方法互调
  • PXE网络装机服务器
  • 简单升级了一下可着色的ListBox控件
  • jsoup入门
  • [分享]iOS开发 - 实现UITableView Plain SectionView和table不停留一起滑动
  • co.js - 让异步代码同步化
  • css属性的继承、初识值、计算值、当前值、应用值
  • echarts花样作死的坑
  • Java精华积累:初学者都应该搞懂的问题
  • JS笔记四:作用域、变量(函数)提升
  • JS专题之继承
  • Spring思维导图,让Spring不再难懂(mvc篇)
  • tab.js分享及浏览器兼容性问题汇总
  • underscore源码剖析之整体架构
  • vue学习系列(二)vue-cli
  • yii2权限控制rbac之rule详细讲解
  • 跨域
  • 聊聊springcloud的EurekaClientAutoConfiguration
  • 每天10道Java面试题,跟我走,offer有!
  • 判断客户端类型,Android,iOS,PC
  • 使用API自动生成工具优化前端工作流
  • 使用putty远程连接linux
  • 怎样选择前端框架
  • 最近的计划
  • ​猴子吃桃问题:每天都吃了前一天剩下的一半多一个。
  • #162 (Div. 2)
  • #中的引用型是什么意识_Java中四种引用有什么区别以及应用场景
  • $HTTP_POST_VARS['']和$_POST['']的区别
  • (附源码)apringboot计算机专业大学生就业指南 毕业设计061355
  • (附源码)springboot高校宿舍交电费系统 毕业设计031552
  • (六) ES6 新特性 —— 迭代器(iterator)
  • (一) springboot详细介绍
  • (转) ns2/nam与nam实现相关的文件
  • (转)人的集合论——移山之道
  • (转)原始图像数据和PDF中的图像数据
  • (转载)CentOS查看系统信息|CentOS查看命令
  • (转载)Linux网络编程入门
  • (轉貼) 2008 Altera 亞洲創新大賽 台灣學生成果傲視全球 [照片花絮] (SOC) (News)
  • .Family_物联网
  • .Mobi域名介绍
  • .MyFile@waifu.club.wis.mkp勒索病毒数据怎么处理|数据解密恢复
  • .NET 6 Mysql Canal (CDC 增量同步,捕获变更数据) 案例版
  • .NET Core 将实体类转换为 SQL(ORM 映射)
  • .NET 编写一个可以异步等待循环中任何一个部分的 Awaiter