聚合分析
聚合分析,英文为Aggregation,是es 除搜索功能外提供的针对es 数据做统计分析的功能
- 功能丰富,提供Bucket、Metric、Pipeline等多种分析方式,可以满足大部分的分析需求
实时性高,所有的计算结果都是即时返回的,而hadoop 等大数据系统一般都是
T+1级别的
为了便于理解,es将聚合分析主要分为如下4类
Bucket,分桶类型,类似SQL中的GROUP BY语法
Metric,指标分析类型,如计算最大值、最小值、平均值等等
Pipeline,管道分析类型,基于上一级的聚合分析结果进行再分析
Matrix,短阵分析类型
Metric
主要分如下两类:
单值分析,只输出一个分析结果
-min,max,avg,sum
-cardinality
多值分析,输出多个分析结果
-stats,extended stats
-percentile, percentile rank
-top hits
Bucket
Pipeline
Pipeline 的分析结果会输出到原结果中,根据输出位置的不同,分为以下两类Parent 结果内嵌到现有的聚合分析结果中
- Derivative
- Moving Average
- Cumulative Sum
Sibling 结果与现有聚合分析结果同级
- Max/Min/Avg/Sum Bucket
- Stats/Extended Stats Bucket
- Percentiles Bucket