当前位置: 首页 > news >正文

Hadoop中MapReduce获取命令行参数例子(11)

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

package cmd;

import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

import mapreduce.MyMapper;
import mapreduce.MyReducer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
import org.apache.hadoop.mapreduce.lib.partition.HashPartitioner;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

/**
 * 计算单词
 * @author Xr
 *
 */
public class WordCountApp  extends Configured implements Tool{
    public static String INPUT_PATH = "";
    public static String OUTPUT_PATH = "";
    @Override
    public int run(String[] args) throws Exception {
        INPUT_PATH = args[0];
        OUTPUT_PATH = args[1];
        Configuration conf = new Configuration();
        
        //判处是否存在输入目录
        existsFile(conf);
        Job job = new Job(conf,WordCountApp.class.getName());
        //打成jar包
        job.setJarByClass(WordCountApp.class);
        //1.1    从哪里读取数据
        FileInputFormat.setInputPaths(job, INPUT_PATH);
        //把输入文本中的每一行解析成一个个键值对
        job.setInputFormatClass(TextInputFormat.class);
        
        //1.2    设置自定义map函数
        job.setMapperClass(MyMapper.class);
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(LongWritable.class);
        
        //1.3    分区
        job.setPartitionerClass(HashPartitioner.class);
        job.setNumReduceTasks(1);
        
        //1.4    TODO    排序分组
        //1.5    TODO    规约
        
        //2.1    是框架做的,不需要程序员手工干预。
        //2.2    自定义reducer函数
        job.setReducerClass(MyReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(LongWritable.class);
        
        //2.3    写入到HDFS中
        FileOutputFormat.setOutputPath(job, new Path(OUTPUT_PATH));
        //格式化类
        job.setOutputFormatClass(TextOutputFormat.class);
        
        //提交给JobTracker去执行
        job.waitForCompletion(true);
        return 0;
    }
    public static void main(String[] args)throws Exception {
        ToolRunner.run(new WordCountApp(), args);
    }
    private static void existsFile(Configuration conf) throws IOException,
            URISyntaxException {
        FileSystem fs = FileSystem.get(new URI(INPUT_PATH), conf);
        if(fs.exists(new Path(OUTPUT_PATH))){
            fs.delete(new Path(OUTPUT_PATH), true);
        }
    }
}
运行:hadoop jar WordCount.jar hdfs://hadoop:9000/hello  hdfs://hadoop:9000/h1


                                                                     Name : Xr
                                                                     Date : 2014-03-02 21:47

转载于:https://my.oschina.net/Xiao629/blog/204439

相关文章:

  • 得到Revit子窗体
  • linux命令行抓取网页快照-(xvfb+CutyCapt)
  • 在eclipse里的 flex 没有可视化的编辑
  • iOS的动态代理模式的实现
  • 关于volatile
  • 通过vbs脚本备份数据-本地到异地
  • 动态SQL和静态SQL
  • hadoop集群监控工具ambari安装
  • MVC 区分是哪按键提交FORM
  • UML画图总结以及浅谈UNL九种图
  • LAMP+extmail+postfix+dovecot
  • 修复被破坏了的linux文件系统分区表
  • poj2488 A Knight's Journey 简单DFS 注意搜索步骤
  • ProgressBar
  • linux 学习(三) php相关
  • Google 是如何开发 Web 框架的
  • 《剑指offer》分解让复杂问题更简单
  • 【140天】尚学堂高淇Java300集视频精华笔记(86-87)
  • 【编码】-360实习笔试编程题(二)-2016.03.29
  • 【跃迁之路】【669天】程序员高效学习方法论探索系列(实验阶段426-2018.12.13)...
  • Angular6错误 Service: No provider for Renderer2
  • Angularjs之国际化
  • CSS盒模型深入
  • ECMAScript入门(七)--Module语法
  • Git 使用集
  • javascript从右向左截取指定位数字符的3种方法
  • JAVA之继承和多态
  • js如何打印object对象
  • node-sass 安装卡在 node scripts/install.js 解决办法
  • PHP 的 SAPI 是个什么东西
  • python_bomb----数据类型总结
  • Python中eval与exec的使用及区别
  • spring学习第二天
  • 从零开始的无人驾驶 1
  • 浅谈Golang中select的用法
  • 使用Swoole加速Laravel(正式环境中)
  • 手机端车牌号码键盘的vue组件
  • 硬币翻转问题,区间操作
  • 栈实现走出迷宫(C++)
  • 字符串匹配基础上
  • ​​​​​​​ubuntu16.04 fastreid训练过程
  • #define、const、typedef的差别
  • ( )的作用是将计算机中的信息传送给用户,计算机应用基础 吉大15春学期《计算机应用基础》在线作业二及答案...
  • (16)Reactor的测试——响应式Spring的道法术器
  • (2.2w字)前端单元测试之Jest详解篇
  • (26)4.7 字符函数和字符串函数
  • (7)STL算法之交换赋值
  • (第一天)包装对象、作用域、创建对象
  • (二)PySpark3:SparkSQL编程
  • (附源码)spring boot北京冬奥会志愿者报名系统 毕业设计 150947
  • (附源码)springboot宠物管理系统 毕业设计 121654
  • (附源码)springboot炼糖厂地磅全自动控制系统 毕业设计 341357
  • (附源码)ssm教师工作量核算统计系统 毕业设计 162307
  • (切换多语言)vantUI+vue-i18n进行国际化配置及新增没有的语言包
  • (转) Android中ViewStub组件使用