当前位置: 首页 > news >正文

Elasticsearch聚合----aggregations的简单使用

文章目录

  • Getting started
    • 1、搜索 address 中包含 mill 的所有人的年龄分布以及平均年龄,但不显示这些人的详情
    • 2、size=0不展示命中记录,只展示聚合结果
    • 3、按照年龄聚合,并且请求这些年龄段的这些人的平均薪资
    • 4、查出所有年龄分布,并且这些年龄段中性别M的平均薪资和性别F的平均薪资以及这个年龄段的总体平均薪资

官方文档

ES中的aggregations提供了数据分析能力,比如从数据中分组和提取数据的能力。最简单的聚合方法大致等于 SQL中GROU BY和SQL中的聚合函数。在 Elasticsearch 中,执行聚合返回 hits(命中结果)的同时还返回聚合结果。
测试数据(account.json)

Getting started

基本语法,使用‘aggs’属性进行标识

  • NAME:自定义当前聚合的名称
  • AGG_TYPE:指定当前聚合的类型
GET bank/_search
{"aggs": {"NAME": {"AGG_TYPE": {}}}
}

1、搜索 address 中包含 mill 的所有人的年龄分布以及平均年龄,但不显示这些人的详情

1、搜索 address 中包含 mill 的所有人的年龄分布

GET bank/_search
{"query": {"match": {"address": "mill"}},"aggs": {"ageAgg": {"terms": {"field": "age","size": 10}}}
}
  • ageAgg:自定义的当前的聚合名称
  • terms:是当前聚合的类型,terms表示分布情况
    • field:表示当前聚合使用哪个字段
    • size:表示显示多少条聚合的信息

在这里插入图片描述
上图中,query的match一共命中了4条记录,其中的aggregations节点展示了当前聚合的结果 ;可以明显的看到ageAgg就是自定义的聚合名称,buckets节点统计的age的分别情况:

  • age=38的记录一共是2条
  • age=28的记录一共是1条
  • age=32的记录一共是1条

2、聚合第一步4个人的平均年龄
以上就是address 中包含 mill 的所有人的年龄分布,接下来聚合这四个人的平均年龄,同样ageAvg是给该聚合结果自定义的一个名称;avg是该聚合类型,表示聚合平均

在这里插入图片描述
下面是**搜索 address 中包含 mill 的所有人的年龄分布以及平均年龄,但不显示这些人的详情 **的完整DSL

GET bank/_search
{"query": {"match": {"address": "mill"}},"aggs": {"ageAgg": {"terms": {"field": "age","size": 10}},"ageAvg":{"avg": {"field": "age"}}},"size": 0
}

2、size=0不展示命中记录,只展示聚合结果

在这里插入图片描述

3、按照年龄聚合,并且请求这些年龄段的这些人的平均薪资

# 2、按照年龄聚合,并且请求这些年龄段的这些人的平均薪资
# 2.1、求出所有的年龄分布
GET bank/_search
{"query": {"match_all": {}},"aggs": {"ageAgg": {"terms": {"field": "age"}}},"size": 0
}
# 2.2、最终;请求这些年龄段的这些人的平均薪资GET bank/_search
{"query": {"match_all": {}},"aggs": {"ageAgg": {"terms": {"field": "age"},"aggs": {"ageGroupBalanceAvg": {"avg": {"field": "balance"}}}}},"size": 0
}

在这里插入图片描述

4、查出所有年龄分布,并且这些年龄段中性别M的平均薪资和性别F的平均薪资以及这个年龄段的总体平均薪资

4.1、聚合所有人的年龄分布

GET bank/_search
{"query": {"match_all": {}},"aggs": {"ageAgg": {"terms": {"field": "age","size": 100}}},"size": 0
}

4.2、在4.1的基础上再对每组中的gender进行分布聚合

# 再所有的年龄分布基础上,再根据gender进行分布
GET bank/_search
{"query": {"match_all": {}},"aggs": {"ageAgg": {"terms": {"field": "age","size": 100},"aggs": {"genderAgg": {"terms": {"field": "gender.keyword","size": 10}}}}},"size": 0
}

在这里插入图片描述
4.3、最后求得每个年龄段的平均薪资

GET bank/_search
{"query": {"match_all": {}},"aggs": {"ageAgg": {"terms": {"field": "age","size": 100},"aggs": {"genderAgg": {"terms": {"field": "gender.keyword","size": 10}},"balanceAvg":{"avg": {"field": "balance"}}}}},"size": 0
}

在这里插入图片描述

相关文章:

  • 软考系统架构师知识点集锦二:软件工程
  • Tensorflow2 中模型训练标签顺序和预测结果标签顺序不一致问题解决办法
  • jsp简单实现新闻发布系统中用户注册确认和用户模拟登录功能的开发
  • 设计模式之代理模式
  • 【RabbitMQ 实战】12 镜像队列
  • 跟我学C++中级篇——右值引用和万能引用
  • Positive Technologies 在迪拜宣布与地区网络安全解决方案提供商开展合作
  • 环形链表(C++解法)
  • 京东销量(销额)数据分析:2023年9月京东奶粉行业品牌销售排行榜
  • Linux高性能服务器编程——ch9笔记
  • 空间统计学:快速理解反距离加权法(IDW)
  • 智能水厂运行与调控3D模拟仿真在线展示提高整个系统的协同效应
  • Docker GitLab-Runner安装
  • 【API篇】八、Flink窗口函数
  • CSS读书笔记
  • IE9 : DOM Exception: INVALID_CHARACTER_ERR (5)
  • SegmentFault for Android 3.0 发布
  • Android系统模拟器绘制实现概述
  • CSS 三角实现
  • css选择器
  • Material Design
  • nodejs调试方法
  • OSS Web直传 (文件图片)
  • rabbitmq延迟消息示例
  • session共享问题解决方案
  • TypeScript迭代器
  • 给第三方使用接口的 URL 签名实现
  • 类orAPI - 收藏集 - 掘金
  • 码农张的Bug人生 - 初来乍到
  • 前端自动化解决方案
  • 世界编程语言排行榜2008年06月(ActionScript 挺进20强)
  • 微信开放平台全网发布【失败】的几点排查方法
  • 好程序员大数据教程Hadoop全分布安装(非HA)
  • 继 XDL 之后,阿里妈妈开源大规模分布式图表征学习框架 Euler ...
  • ​人工智能书单(数学基础篇)
  • # 20155222 2016-2017-2 《Java程序设计》第5周学习总结
  • #NOIP 2014#day.2 T1 无限网络发射器选址
  • #微信小程序(布局、渲染层基础知识)
  • (1)Nginx简介和安装教程
  • (2)STM32单片机上位机
  • (C++)八皇后问题
  • (rabbitmq的高级特性)消息可靠性
  • (TipsTricks)用客户端模板精简JavaScript代码
  • (附源码)springboot 校园学生兼职系统 毕业设计 742122
  • (心得)获取一个数二进制序列中所有的偶数位和奇数位, 分别输出二进制序列。
  • (原創) 如何解决make kernel时『clock skew detected』的warning? (OS) (Linux)
  • (转)JAVA中的堆栈
  • (转)四层和七层负载均衡的区别
  • ******IT公司面试题汇总+优秀技术博客汇总
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • .[hudsonL@cock.li].mkp勒索病毒数据怎么处理|数据解密恢复
  • .NET Core中的去虚
  • .NET/ASP.NETMVC 大型站点架构设计—迁移Model元数据设置项(自定义元数据提供程序)...
  • .NetCore Flurl.Http 升级到4.0后 https 无法建立SSL连接
  • .NET基础篇——反射的奥妙