当前位置: 首页 > news >正文

Hadoop计算文件大小

//Hadoop计算文件大小:

public static void main(String[] args) throws IOException{

      String tablePath= pathPrefix + args[0].toLowerCase().trim();

      Path p = new Path(tablePath);

      JobConf conf= new JobConf();

      FileSystem fs = p.getFileSystem(conf);

      for(FileStatus f : fs.listStatus(p)){

       if(f.isDir()){

         long len = 0L;

         for(FileStatus file: fs.listStatus(f.getPath())){

            len = len + file.getLen();

         }

         System.out.println(f.getPath().toString().replace(pathPrefix"")

               .replace(args[0].toLowerCase().trim(), "")+" size:  "+ len/1024/1024+"  MB");

       }

      }

   }

private static final String pathPrefix = "hdfs://hdpnn:9000/group/alibaba-dw-icbu/hive/";


相关文章:

  • 在Oracle中利用SQL_TRACE跟踪SQL的执行
  • Linux添加/删除用户和用户组
  • Hive优化(3)之随机数避免数据倾斜
  • Angular2学习(一)
  • hive优化(4)之mapjoin和union all避免数据倾斜
  • hive cli
  • Hive优化(5)之选择合适的map数
  • C++ 文件操作(CFile类)
  • Hadoop MapReduce:详解Shuffle过程
  • 编译树莓派2代B型OpenWrt固件实现无线路由器及nodogsplash认证功能
  • 为什么一些公司把dwg文件转化为pdf
  • hadoop生态系统
  • influxDB 变换类函数
  • C# Android 开发中使用 Sqlite.NET ORM
  • 大数据到底怎么学:数据科学概论与大数据学习误区
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • 【译】React性能工程(下) -- 深入研究React性能调试
  • 2017 前端面试准备 - 收藏集 - 掘金
  • CSS相对定位
  • httpie使用详解
  • Idea+maven+scala构建包并在spark on yarn 运行
  • Java多态
  • node-sass 安装卡在 node scripts/install.js 解决办法
  • Spring思维导图,让Spring不再难懂(mvc篇)
  • Vue ES6 Jade Scss Webpack Gulp
  • Vue全家桶实现一个Web App
  • Webpack4 学习笔记 - 01:webpack的安装和简单配置
  • 等保2.0 | 几维安全发布等保检测、等保加固专版 加速企业等保合规
  • 多线程 start 和 run 方法到底有什么区别?
  • 数据库写操作弃用“SELECT ... FOR UPDATE”解决方案
  • 网络应用优化——时延与带宽
  • 微服务核心架构梳理
  • 一个普通的 5 年iOS开发者的自我总结,以及5年开发经历和感想!
  • ​LeetCode解法汇总1276. 不浪费原料的汉堡制作方案
  • ​ubuntu下安装kvm虚拟机
  • #我与Java虚拟机的故事#连载07:我放弃了对JVM的进一步学习
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (06)Hive——正则表达式
  • (14)目标检测_SSD训练代码基于pytorch搭建代码
  • (2)STL算法之元素计数
  • (附源码)springboot宠物医疗服务网站 毕业设计688413
  • (论文阅读11/100)Fast R-CNN
  • (轉貼) VS2005 快捷键 (初級) (.NET) (Visual Studio)
  • .NET Core SkiaSharp 替代 System.Drawing.Common 的一些用法
  • .NET 读取 JSON格式的数据
  • .net 获取url的方法
  • .net 逐行读取大文本文件_如何使用 Java 灵活读取 Excel 内容 ?
  • .NET 自定义中间件 判断是否存在 AllowAnonymousAttribute 特性 来判断是否需要身份验证
  • .net打印*三角形
  • .NET下的多线程编程—1-线程机制概述
  • .vollhavhelp-V-XXXXXXXX勒索病毒的最新威胁:如何恢复您的数据?
  • [ vulhub漏洞复现篇 ] AppWeb认证绕过漏洞(CVE-2018-8715)
  • [1127]图形打印 sdutOJ
  • [Android Pro] listView和GridView的item设置的高度和宽度不起作用
  • [Avalon] Avalon中的Conditional Formatting.