当前位置: 首页 > news >正文

大数据学习(23)-hive on mapreduce对比hive on spark

&&大数据学习&&

🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门
💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞


Hive on Spark 和 Hive on MapReduce 是两种不同的 Hive 运行环境,它们分别使用 Apache Spark 和 Apache MapReduce 作为底层的计算引擎。

  1. Hive on Spark:
    Hive on Spark 是使用 Apache Spark 作为计算引擎的 Hive 版本。它利用 Spark 的分布式计算和内存计算能力,提高了 Hive 的查询性能和响应时间。与传统的 Hive on MapReduce 相比,Hive on Spark 可以更好地利用集群资源,提高查询效率。

Hive on Spark 的优点包括:

  • 性能提升:Spark 的内存计算能力可以减少磁盘 I/O 操作,提高查询速度。
  • 动态数据流:Spark 支持实时数据流处理,可以轻松地与 Hive 集成,实现实时数据分析。
  • 通用性:Spark 可以运行在多种集群管理器(如 YARN、Mesos、Kubernetes)上,具有更好的通用性。
  1. Hive on MapReduce:
    Hive on MapReduce 是使用 Apache MapReduce 作为计算引擎的 Hive 版本。MapReduce 是一种分布式计算框架,将任务分割成多个小任务,并在集群中的多个节点上并行执行。Hive on MapReduce 主要面向批处理查询,适合处理大规模数据集。

Hive on MapReduce 的优点包括:

  • 稳定性:MapReduce 框架经过多年发展和广泛应用,具有较高的稳定性和可靠性。
  • 数据处理能力:MapReduce 可以处理复杂的数据处理任务,支持自定义 Map 和 Reduce 函数,适用于复杂的分析和查询操作。
  • 批处理:Hive on MapReduce 适合批处理大量数据,可以处理超大规模数据集。

需要注意的是,随着 Apache Spark 的普及和发展,Hive on Spark 逐渐成为主流的 Hive 运行环境。许多公司和组织已经将 Spark 作为其默认的计算引擎,并逐渐将 Hive 从 MapReduce 迁移到 Spark 上。然而,对于一些特定的数据分析和查询需求,Hive on MapReduce 可能仍然具有其优势和用途。

相关文章:

  • 性能压测工具:wrk
  • 报错0x0000007b问题解决
  • 【经典小练习】输出文件路径名
  • Vue中的$nextTick的作用
  • QT visual stdio加载动态库报错126问题
  • 【代码随想录】算法训练计划28
  • 5、LED流水灯
  • python:傅里叶分析,傅里叶变换 FFT
  • vue2-006——使用脚手架搭建vue2项目+项目结构分析
  • OpenGL 图元赋色(Qt)
  • 大数据预处理技术
  • HOOPS Web平台助力开发3D应用,实现超大规模3D web轻量化渲染与数据格式转换!
  • 品优购首页快捷导航部分
  • postman和Jmeter做接口测试的区别(经验之谈)
  • Axios笔记
  • 【译】JS基础算法脚本:字符串结尾
  • 时间复杂度分析经典问题——最大子序列和
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • HTTP传输编码增加了传输量,只为解决这一个问题 | 实用 HTTP
  • jquery ajax学习笔记
  • Python - 闭包Closure
  • python3 使用 asyncio 代替线程
  • React 快速上手 - 06 容器组件、展示组件、操作组件
  • Shadow DOM 内部构造及如何构建独立组件
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 简单实现一个textarea自适应高度
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • 实战|智能家居行业移动应用性能分析
  • 通过来模仿稀土掘金个人页面的布局来学习使用CoordinatorLayout
  • 一些基于React、Vue、Node.js、MongoDB技术栈的实践项目
  • ​MySQL主从复制一致性检测
  • # 手柄编程_北通阿修罗3动手评:一款兼具功能、操控性的电竞手柄
  • #{}和${}的区别是什么 -- java面试
  • #define
  • #define MODIFY_REG(REG, CLEARMASK, SETMASK)
  • #我与Java虚拟机的故事#连载07:我放弃了对JVM的进一步学习
  • $.ajax()参数及用法
  • (9)目标检测_SSD的原理
  • (C语言版)链表(三)——实现双向链表创建、删除、插入、释放内存等简单操作...
  • (Matalb回归预测)PSO-BP粒子群算法优化BP神经网络的多维回归预测
  • (待修改)PyG安装步骤
  • (附源码)springboot家庭装修管理系统 毕业设计 613205
  • (续)使用Django搭建一个完整的项目(Centos7+Nginx)
  • (转)linux 命令大全
  • ***通过什么方式***网吧
  • *ST京蓝入股力合节能 着力绿色智慧城市服务
  • .Net 8.0 新的变化
  • .net Signalr 使用笔记
  • .NET 表达式计算:Expression Evaluator
  • .NET/ASP.NETMVC 大型站点架构设计—迁移Model元数据设置项(自定义元数据提供程序)...
  • .NET开源的一个小而快并且功能强大的 Windows 动态桌面软件 - DreamScene2
  • .NET企业级应用架构设计系列之技术选型
  • .NET设计模式(2):单件模式(Singleton Pattern)
  • @Bean, @Component, @Configuration简析
  • @entity 不限字节长度的类型_一文读懂Redis常见对象类型的底层数据结构