当前位置: 首页 > news >正文

【hadoop】为什么要用hadoop?

1、为什么不用 [数据库]+[更多的磁盘] 来做大规模的批量分析而用map reduce?

1、寻址时间的提高速度远远慢于传输速率的提高

2、更新一小部分数据时传统数据库效果好(B树数据库),更新大部分数据时,没有MapRecude效率高。

3、RDBMS 适合点查询和更新,MapReduce适合处理那些需要分析整个数据集的问题(批处理)。

4、MapReduce适合一次写入多次读取。

5、RDBMS 操作的数据是结构化的,MapReduce对半结构化/非结构化的数据(纯文本/图片等)非常有效。

相关文章:

  • 【容器适配器】什么是容器适配器和用法
  • 【socket】setsockopt函数的作用和说明
  • 【hadoop】Hadoop编程实例之MapReduce
  • 【VS】发布库lib/dll 带运行环境(/MT、/MTd、/MD、/MDd)静态库/动态库
  • 【linux】Rehat linux离线安装GCC等软件的方法
  • 【‘前端‘框架】React、Vue、Bootstrap、easyUI 、AngularJS 的区别
  • 【java】什么是maven
  • 【Protocol Buffer】Windows Protocol Buffer 使用教程[实践中...]
  • 【java】115-Java经典
  • 【Hbase】HBase入门教程
  • 【前端框架】前端框架学习
  • 【try……catch】C++ try…… catch 笔记(C语言中也可以Try-Catch异常处理)
  • 【消息中间件】Kafka、RabbitMQ、RocketMQ等消息中间件 学习笔记
  • 【Cmake】Cmake windows下的使用方法|linux 下|命令行用法
  • 【经验】开发面向多种客户端的Server(服务端)需要考虑的问题
  • [笔记] php常见简单功能及函数
  • 「面试题」如何实现一个圣杯布局?
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • HTML5新特性总结
  • Java 23种设计模式 之单例模式 7种实现方式
  • Linux Process Manage
  • python学习笔记 - ThreadLocal
  • SAP云平台运行环境Cloud Foundry和Neo的区别
  • vue:响应原理
  • vue-router 实现分析
  • -- 查询加强-- 使用如何where子句进行筛选,% _ like的使用
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 记一次删除Git记录中的大文件的过程
  • 简单基于spring的redis配置(单机和集群模式)
  • 蓝海存储开关机注意事项总结
  • 什么软件可以提取视频中的音频制作成手机铃声
  • 使用parted解决大于2T的磁盘分区
  • 听说你叫Java(二)–Servlet请求
  • hi-nginx-1.3.4编译安装
  • 关于Android全面屏虚拟导航栏的适配总结
  • ​sqlite3 --- SQLite 数据库 DB-API 2.0 接口模块​
  • #Linux(Source Insight安装及工程建立)
  • #Spring-boot高级
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (Redis使用系列) SpringBoot中Redis的RedisConfig 二
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (超简单)构建高可用网络应用:使用Nginx进行负载均衡与健康检查
  • (附源码)ssm户外用品商城 毕业设计 112346
  • (附源码)ssm失物招领系统 毕业设计 182317
  • (附源码)计算机毕业设计ssm基于B_S的汽车售后服务管理系统
  • (实战篇)如何缓存数据
  • (顺序)容器的好伴侣 --- 容器适配器
  • (一)80c52学习之旅-起始篇
  • (转)Groupon前传:从10个月的失败作品修改,1个月找到成功
  • (转)Oracle存储过程编写经验和优化措施
  • (最简单,详细,直接上手)uniapp/vue中英文多语言切换
  • ***监测系统的构建(chkrootkit )
  • .NET Compact Framework 3.5 支持 WCF 的子集
  • .net core webapi 大文件上传到wwwroot文件夹
  • .Net Memory Profiler的使用举例