当前位置: 首页 > news >正文

hadoop3跑第一个例子wordcount

1、创建目录

hdfs dfs -mkdir -p /user/input

2、创建测试文件,并上传文件到hdfs

echo '1' > 1.txt
hdfs dfs -put 1.txt /user/input

3、进入hadoop-3目录,并创建测试文件

cd /app/hadoop-3

创建目录
mkdir wcinput
cd wcinput
保存wc.input
nano wc.input

hadoop yarn
hadoop mapreduce
spark
spark

上传文件

hdfs dfs -put wcinput/wc.input /user/input/

4、使用词频测试wordcount

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /user/input/ /user/output

问题:
如果卡住很久,修改更改mapred-site.xml文件将

<property><name>mapreduce.framework.name</name><value>yarn</value>
</property>

改为:

<property><name>mapreduce.job.tracker</name><value>hdfs://此处为自己的电脑IP:8001</value><final>true</final></property>

再次运行即可。

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /user/input/ /user/output

5、输出统计结果

hdfs dfs -cat /user/output/*

6、修改hdfs的权限 不一定用

hdfs dfs -chmod -R 755 / 

7、常用地址
http://192.168.6.19:9870/ 查看文件
http://192.168.6.19:8088/查看mapreduce情况
8、删除输出目录

hdfs dfs -rm -R /user/output

9、如果跑例子时提示出错,找不到resource-types.xml文件,则
nano etc/hadoop/resource-types.xml
内容如下:

<configuration><property><name>yarn.resource-types</name><value>resource1, resource2</value></property><property><name>yarn.resource-types.resource1.units</name><value>G</value></property><property><name>yarn.resource-types.resource2.minimum</name><value>1</value></property><property><name>yarn.resource-types.resource2.maximum</name><value>1024</value></property>
</configuration>

10、 提示错误:Couldn’t preview the file. NetworkError: Failed to execute ‘send’ on ‘XMLHttpRequest’: Failed to load
hdfs-site.xml 增加内容,用于web预览文件

<property><name>dfs.webhdfs.enabled</name><value>true</value>
</property>

11、如果windows下需要预览文件
在C:\Windows\System32\drivers\etc\hosts
增加: 192.168.6.19 master 即可

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 加载资源时报错-ERR_CONNECTION_RESET,需要多次请求才能拿到资源的有效解决方案
  • Java 入门指南:JVM(Java虚拟机)——类的生命周期与加载过程
  • 【GO语言】Go语言详解与应用场景分析,与Java的对比及优缺点
  • 【RabbitMQ 项目】服务端数据管理模块之交换机管理
  • 项目需求 | MySQL增量备份与恢复的完整操作指南
  • 「OC」事件点击demo合集
  • 【智路】智路OS Perception Fusion Service
  • spring boot设置多环境的配置文件
  • 【Android Studio】使用雷电模拟器调试
  • 研1日记12
  • SpringBlade dict-biz/list 接口 SQL 注入漏洞
  • 从大脑图谱/ROI中提取BOLD信号
  • linux学习--第五天
  • PG表空间
  • unity3d入门教程五
  • [数据结构]链表的实现在PHP中
  • 〔开发系列〕一次关于小程序开发的深度总结
  • CAP理论的例子讲解
  • CoolViewPager:即刻刷新,自定义边缘效果颜色,双向自动循环,内置垂直切换效果,想要的都在这里...
  • CSS3 变换
  • HomeBrew常规使用教程
  • JavaScript的使用你知道几种?(上)
  • php的插入排序,通过双层for循环
  • ucore操作系统实验笔记 - 重新理解中断
  • 不用申请服务号就可以开发微信支付/支付宝/QQ钱包支付!附:直接可用的代码+demo...
  • 如何使用 JavaScript 解析 URL
  • 深度学习在携程攻略社区的应用
  • 我有几个粽子,和一个故事
  • 一些基于React、Vue、Node.js、MongoDB技术栈的实践项目
  • 自动记录MySQL慢查询快照脚本
  • 《TCP IP 详解卷1:协议》阅读笔记 - 第六章
  • 说说我为什么看好Spring Cloud Alibaba
  • ‌移动管家手机智能控制汽车系统
  • # 20155222 2016-2017-2 《Java程序设计》第5周学习总结
  • #70结构体案例1(导师,学生,成绩)
  • #pragma 指令
  • $ git push -u origin master 推送到远程库出错
  • $.ajax中的eval及dataType
  • $HTTP_POST_VARS['']和$_POST['']的区别
  • (07)Hive——窗口函数详解
  • (3)医疗图像处理:MRI磁共振成像-快速采集--(杨正汉)
  • (JS基础)String 类型
  • (MIT博士)林达华老师-概率模型与计算机视觉”
  • (Redis使用系列) Springboot 使用Redis+Session实现Session共享 ,简单的单点登录 五
  • (搬运以学习)flask 上下文的实现
  • (超简单)使用vuepress搭建自己的博客并部署到github pages上
  • (代码示例)使用setTimeout来延迟加载JS脚本文件
  • (九十四)函数和二维数组
  • (全注解开发)学习Spring-MVC的第三天
  • (实战篇)如何缓存数据
  • (转)socket Aio demo
  • (转)真正的中国天气api接口xml,json(求加精) ...
  • .md即markdown文件的基本常用编写语法
  • .Net各种迷惑命名解释
  • .net流程开发平台的一些难点(1)