当前位置：首页 > news >正文

浅谈Hadoop (r4笔记第81天)

news 来源：原创 2024/5/16 22:02:27

大数据的概念炒了好多年了，很显然这项技术经受住了时间的考验，不是有些人想的那样华而不实，多年来总是伴随着Hadoop的身影越发壮大。这些年来数据的增长量真是发生了天翻地覆的变化，原来大家过年的时候都会很认真的拍一张全家福，恨不得把胶卷能够正反两用，多存点照片，现在好了，手机各类终端齐上阵，微博，微信，图片，小视频，所有的数据真是应有尽有。数据量上来了，数据的分析工作就显得尤为重要了。用现在很形象的一种描述就是，让数据说话。Hadoop的使命就是主要海量数据的存储和分析，也有两个核心的功能，一个是HDFS,一个就是MapReduce。怎么理解呢，HDFS就是Hadoop Distributed FileSystem, MapReduce是一个编程模型，所做的工作是map和reduce两部分，这些海量数据需要存储，这个很容易理解，那么什么是MapReduce呢？举一个简单的例子。我们存在一些文本数据，是关于pm2.5的。记录了每天的数据情况。内容如下：20150321 01 6020150321 06 5020150321 12 10020150320 01 20020150320 06 15020150320 12 16020150319 01 15020150319 06 20020150321 6020150321 5020150321 (100)20150320 (200)20150319 (200)

相关文章：

MongoDB初探第二篇 (r4笔记第82天)

大话UML中类之间的关系 (r4笔记第83天)

关于Oracle的技术问答 (r4笔记第85天)

【非原创】完全用Linux工作(下)(r4笔记第86天)

【非原创】完全用Linux工作(上)(r4笔记第86天)

一条delete语句的调优(r4笔记第86天)

【非本人原创】突然35岁：捡点我的职业生涯(下)(r4笔记第87天)

【非本人原创】突然35岁：捡点我的职业生涯(上)(r4笔记第87天)

delete相关的pl/sql调优(r4笔记第87天)

【非原创】这一生至少当一次傻瓜(r4笔记第88天)

海量数据迁移之数据加载流程(r4笔记第88天)

设计模式之工厂方法（r4笔记第89天)

database replay基础学习(r4笔记第90天)

结合EM快速解决复杂的配置问题(r4笔记第91天)

世界级Oracle专家Jonathan Lewis：我很为DBA们的未来担(r4笔记第92天)

收藏网友的源程序下载网

Fundebug计费标准解释：事件数是如何定义的？

idea + plantuml 画流程图

Java精华积累：初学者都应该搞懂的问题

js ES6 求数组的交集，并集，还有差集

nodejs：开发并发布一个nodejs包

SpiderData 2019年2月16日 DApp数据排行榜

Zepto.js源码学习之二

二维平面内的碰撞检测【一】

工作手记之html2canvas使用概述

开发了一款写作软件(OSX,Windows)，附带Electron开发指南

码农张的Bug人生 - 初来乍到

使用权重正则化较少模型过拟合

小而合理的前端理论：rscss和rsjs

分布式关系型数据库服务 DRDS 支持显示的 Prepare 及逻辑库锁功能等多项能力 ...

继 XDL 之后，阿里妈妈开源大规模分布式图表征学习框架 Euler ...

#HarmonyOS:软件安装window和mac预览Hello World

#WEB前端（HTML属性）

$forceUpdate()函数

（11）MATLAB PCA+SVM 人脸识别

（3）(3.5) 遥测无线电区域条例

(day6) 319. 灯泡开关

（附源码）spring boot火车票售卖系统毕业设计 211004

（附源码）ssm码农论坛毕业设计 231126

（六）什么是Vite——热更新时vite、webpack做了什么

（三）Honghu Cloud云架构一定时调度平台

（十）DDRC架构组成、效率Efficiency及功能实现

（详细版）Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models

(转)关于多人操作数据的处理策略

(转)清华学霸演讲稿：永远不要说你已经尽力了

（状压dp）uva 10817 Headmaster's Headache

*2 echo、printf、mkdir命令的应用

.NET Core SkiaSharp 替代 System.Drawing.Common 的一些用法

.NET Micro Framework初体验

.Net Remoting常用部署结构

.NET面试题(二)

//解决validator验证插件多个name相同只验证第一的问题

/dev/sda2 is mounted; will not make a filesystem here!

?.的用法

@CacheInvalidate(name = “xxx“, key = “#results.![a+b]“,multi = true)是什么意思