当前位置: 首页 > news >正文

hive 数据清理--数据去重


hive> select * from (select *,row_number() over (partition by id) num from t_link) t where t.num=1;

  

保留crt_time最新的一个数据

select * from (select *,row_number() over (partition by id order by crt_time desc) num from t_link) t where t.num=1;

将查询的去重数据保存到新表t_link2中,新表比源表t_link多一列

insert overwrite table t_link2 select * from (select *,row_number() over (partition by id order by crt_time desc) num from t_link) t where t.num=1;

  

转载于:https://www.cnblogs.com/duking1991/p/6095608.html

相关文章:

  • rails生成器生成自定义controller模板
  • 关于适配器中设置显示与隐藏的问题
  • 递归的例子
  • 各种居中对齐
  • 面向对象 封装 、继承
  • [学习笔记]背包问题(一)
  • SQL 基础语法(一)
  • HTTP慢速DOS(slow http denial of service attack)
  • PAT甲题题解-1104. Sum of Number Segments (20)-(水题)
  • Java 8 Lambda表达式,让你的代码更简洁
  • 使用scrapy创建工程
  • 文件属性
  • 插入排序
  • python核心编程第六章练习--6.5.d
  • python 迭代器和生成器
  • SegmentFault for Android 3.0 发布
  • [译]Python中的类属性与实例属性的区别
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • echarts的各种常用效果展示
  • github指令
  • java8 Stream Pipelines 浅析
  • PAT A1120
  • PermissionScope Swift4 兼容问题
  • PHP的类修饰符与访问修饰符
  • React-redux的原理以及使用
  • React-生命周期杂记
  • 从setTimeout-setInterval看JS线程
  • 动态规划入门(以爬楼梯为例)
  • 分享自己折腾多时的一套 vue 组件 --we-vue
  • 基于MaxCompute打造轻盈的人人车移动端数据平台
  • 浅析微信支付:申请退款、退款回调接口、查询退款
  • 山寨一个 Promise
  • 温故知新之javascript面向对象
  • 带你开发类似Pokemon Go的AR游戏
  • ​​​​​​​​​​​​​​Γ函数
  • ​Python 3 新特性:类型注解
  • # MySQL server 层和存储引擎层是怎么交互数据的?
  • (173)FPGA约束:单周期时序分析或默认时序分析
  • (26)4.7 字符函数和字符串函数
  • (C语言)求出1,2,5三个数不同个数组合为100的组合个数
  • (ResultSet.TYPE_SCROLL_INSENSITIVE,ResultSet.CONCUR_READ_ONLY)讲解
  • (二十三)Flask之高频面试点
  • (附源码)springboot教学评价 毕业设计 641310
  • (三)mysql_MYSQL(三)
  • (深入.Net平台的软件系统分层开发).第一章.上机练习.20170424
  • (实战篇)如何缓存数据
  • (四)鸿鹄云架构一服务注册中心
  • .NET 3.0 Framework已经被添加到WindowUpdate
  • .net core MVC 通过 Filters 过滤器拦截请求及响应内容
  • .net core 依赖注入的基本用发
  • .NET Core实战项目之CMS 第一章 入门篇-开篇及总体规划
  • .NET MVC第五章、模型绑定获取表单数据
  • .NET Standard / dotnet-core / net472 —— .NET 究竟应该如何大小写?
  • .NET 除了用 Task 之外,如何自己写一个可以 await 的对象?
  • .NET/C# 使用 SpanT 为字符串处理提升性能