当前位置: 首页 > news >正文

HIVE中内连接和左半连接不一致问题

 一、理论

HIVE中都是按等值连接来统计的,理论上两种写法统计结果应该是一致的;

二、实际情况

但实际使用中发现两种写法会返回的结果,总会有一些差距虽然差别不大,但让人很是困惑。

三、原因

当使用join on的时候,如果右表有重复数据就会关联更多的数据,因为它们都符合join on上的条件;

而使用left semi join的时候,当join左侧表中的记录在join右侧表上查询到符合条件的记录就会返回,而不会再继续查找右侧表中剩余记录了,所以即使右侧表中有重复,也不会对统计结果有啥影响。 

转载于:https://www.cnblogs.com/liutoutou/p/3529470.html

相关文章:

  • 海量空间数据库实施策略-栅格数据 8
  • Entity Framework 并发处理(转)
  • 总结 — 各种数据访问方式
  • 《海量空间数据库实施策略-栅格数据》PDF版本
  • WhyEngine游戏合集2014贺岁版
  • 基于属性的编辑器框架
  • Windows Phone 7 SDK 正式版本RTW
  • 解读Linux命令格式(转)
  • 通过手机摄像头实现动作追踪一----单帧的识别
  • PL/SQL Developer 9.x 注册码
  • 公司到底是怎么看我们的——Leo网上答疑47
  • Ext 2.2在IE 9运行居然说Ext-all.j运行错误,晕死了
  • 解决局域网文件共享设置
  • Socket 编程IO Multiplexing
  • Android 上传文件
  • $translatePartialLoader加载失败及解决方式
  • 【跃迁之路】【669天】程序员高效学习方法论探索系列(实验阶段426-2018.12.13)...
  • Android组件 - 收藏集 - 掘金
  • Apache Zeppelin在Apache Trafodion上的可视化
  • Java 11 发布计划来了,已确定 3个 新特性!!
  • Java到底能干嘛?
  • JSONP原理
  • JS函数式编程 数组部分风格 ES6版
  • MySQL用户中的%到底包不包括localhost?
  • Netty+SpringBoot+FastDFS+Html5实现聊天App(六)
  • 创建一种深思熟虑的文化
  • 开发了一款写作软件(OSX,Windows),附带Electron开发指南
  • 为视图添加丝滑的水波纹
  • 我是如何设计 Upload 上传组件的
  • 完善智慧办公建设,小熊U租获京东数千万元A+轮融资 ...
  • !! 2.对十份论文和报告中的关于OpenCV和Android NDK开发的总结
  • $NOIp2018$劝退记
  • (20)目标检测算法之YOLOv5计算预选框、详解anchor计算
  • (C#)if (this == null)?你在逗我,this 怎么可能为 null!用 IL 编译和反编译看穿一切
  • (LeetCode 49)Anagrams
  • (二)Pytorch快速搭建神经网络模型实现气温预测回归(代码+详细注解)
  • (原创)Stanford Machine Learning (by Andrew NG) --- (week 9) Anomaly DetectionRecommender Systems...
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • .Net(C#)常用转换byte转uint32、byte转float等
  • .NET开发不可不知、不可不用的辅助类(三)(报表导出---终结版)
  • .NET企业级应用架构设计系列之应用服务器
  • /etc/sudoer文件配置简析
  • [ 蓝桥杯Web真题 ]-布局切换
  • [AutoSar]BSW_Com02 PDU详解
  • [bug总结]: Feign调用GET请求找不到请求体实体类
  • [codeforces] 25E Test || hash
  • [cogs2652]秘术「天文密葬法」
  • [Docker]十一.Docker Swarm集群raft算法,Docker Swarm Web管理工具
  • [emacs] CUA的矩形块操作很给力啊
  • [git] windows系统安装git教程和配置
  • [Go WebSocket] 多房间的聊天室(五)用多个小锁代替大锁,提高效率
  • [IE编程] WebBrowser控件的多页面浏览(Tabbed Browsing)开发接口
  • [IE编程] 多页面基于IE内核浏览器的代码示例
  • [LeetCode] Sort List
  • [Linux]进程间通信(进程间通信介绍 | 匿名管道 | 命名管道)