当前位置: 首页 > news >正文

SQL进阶技巧:如何按照固定尺寸(固定区间)对数据进行打分类标签?

目录

0 问题引入

应用案例1

应用案例2

 小结


0 问题引入

   在日常数据分析中,经常会遇到数据产品经理或数据分析师提出这样的需求,比如按照某一给定的区间或数据范围对数据进行分类标签,而遇到这样的问题,好多同学感觉SQL做起来有点困难或无从下手,其实面对这样的问题笔者早在其他文章中已经进行总结,笔者将这类问题归结为分桶问题,而分桶问题又分为两类,一类是桶个数一定,但是桶尺寸不固定的分桶,一类是桶尺寸一定,但是桶个数不一定的分桶,针对这两种分桶的方式,我们分别给出如下解决方案。

第一类:桶个数一定,桶尺寸不定,用函数 ntile(),ntile函数中传的参数即为需要分桶的个数。具体需要根据需求分析出桶个数,比如需求中求按照收入前10%的人群进行圈选,此时就需要对收入字段进行分桶,分多少桶?由于需求中已经给出10%的数字,那么桶的个数即为10,桶号为1的标签即为所要的结果。

第二类:桶个数不固定,桶尺寸固定,这类问题,往往用公式法。此类的需求往往都是给定一定的区间,比如按照某个固定区间的范围,0-10,11-20,21-30...等等,这类问题需要先分析清楚固定区间的长度是多少,如上述区间长度即为10,那么我们可以用如下公式:

                                               

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Docker 安装 PostgreSQL
  • 实习随笔【前端技术实现全局添加水印】
  • 【java深入学习第7章】用 Spring Boot 和 Java Mail 轻松实现邮件发送功能
  • 电脑远程开关机
  • 【找不到视图问题解决】@RestController 与 @Controller注解的使用区别
  • 大数据hive表和iceberg表格式
  • 【乐吾乐2D可视化组态编辑器】消息
  • 论文翻译:通过云计算对联网多智能体系统进行预测控制
  • notes for datawhale 2th summer camp NLP task1
  • JSqlParser 解析 sql
  • Linux介绍以及常用命令
  • html+js+css做的扫雷
  • 使用mybatis的statementHander拦截器监控表和字段并发送钉钉消息
  • Python面经
  • FlinkErr:org/apache/hadoop/hive/ql/parse/SemanticException
  • 9月CHINA-PUB-OPENDAY技术沙龙——IPHONE
  • __proto__ 和 prototype的关系
  • 「面试题」如何实现一个圣杯布局?
  • - C#编程大幅提高OUTLOOK的邮件搜索能力!
  • Electron入门介绍
  • Java的Interrupt与线程中断
  • Java-详解HashMap
  • jquery cookie
  • Redis的resp协议
  • vue学习系列(二)vue-cli
  • 力扣(LeetCode)21
  • 悄悄地说一个bug
  • 少走弯路,给Java 1~5 年程序员的建议
  • media数据库操作,可以进行增删改查,实现回收站,隐私照片功能 SharedPreferences存储地址:
  • Nginx惊现漏洞 百万网站面临“拖库”风险
  • 摩拜创始人胡玮炜也彻底离开了,共享单车行业还有未来吗? ...
  • ​Kaggle X光肺炎检测比赛第二名方案解析 | CVPR 2020 Workshop
  • #、%和$符号在OGNL表达式中经常出现
  • #13 yum、编译安装与sed命令的使用
  • ( )的作用是将计算机中的信息传送给用户,计算机应用基础 吉大15春学期《计算机应用基础》在线作业二及答案...
  • (Matlab)遗传算法优化的BP神经网络实现回归预测
  • (STM32笔记)九、RCC时钟树与时钟 第二部分
  • (笔记)Kotlin——Android封装ViewBinding之二 优化
  • (一)【Jmeter】JDK及Jmeter的安装部署及简单配置
  • (原創) 博客園正式支援VHDL語法著色功能 (SOC) (VHDL)
  • (转)清华学霸演讲稿:永远不要说你已经尽力了
  • ../depcomp: line 571: exec: g++: not found
  • .bat批处理(五):遍历指定目录下资源文件并更新
  • .describe() python_Python-Win32com-Excel
  • .net core 6 集成 elasticsearch 并 使用分词器
  • .net core 使用js,.net core 使用javascript,在.net core项目中怎么使用javascript
  • .NET Core日志内容详解,详解不同日志级别的区别和有关日志记录的实用工具和第三方库详解与示例
  • .net core使用EPPlus设置Excel的页眉和页脚
  • .net 获取某一天 在当月是 第几周 函数
  • .Net的C#语言取月份数值对应的MonthName值
  • .net和jar包windows服务部署
  • @require_PUTNameError: name ‘require_PUT‘ is not defined 解决方法
  • []C/C++读取串口接收到的数据程序
  • [2021]Zookeeper getAcl命令未授权访问漏洞概述与解决
  • [acm算法学习] 后缀数组SA