日常开发中,如果使用数据库来直接查询一组数据的分位数,就比较简单,直接使用对应的函数就可以了,例如:
PERCENT_RANK() OVER(PARTITION BY 分组列名 ORDER BY 目标列名) AS 目标列名_分位数
如果是需要在代码逻辑部分进行分位数的计算,就需要我们自己写一个工具类来支持计算了
import static java.lang.Float.NaN;
public static Double getPercentile(List<Double> dataList, double target) {
double[] doubles = Doubles.toArray(dataList); // 将List转换为数组
Arrays.sort(doubles); // 对数组进行升序排序
double result; // 结果
int lt = 0; // 小于target的数量
int lt2 = 1; // 重复的小于target的数量
int pos = -1; // target在数组中的位置
double a = NaN; // 小于target的前一个值
double c = NaN; // 大于等于target的第一个值
for (int i = 0; i < doubles.length; i++) {
if (doubles[i] == target) {
pos = i; // 找到target的位置
break;
} else if (doubles[i] < target) {
lt++; // 小于target的数量加一
if (doubles[i] == a) {
lt2++; // 重复的小于target的数量加一
} else {
lt2 = 1; // 重置重复的小于target的数量
a = doubles[i]; // 更新小于target的前一个值
}
} else {
c = doubles[i]; // 找到大于等于target的第一个值
break;
}
}
result = (double) lt / (doubles.length - 1); // 计算百分位数
if (pos < 0) {
double pa = (double) (lt - lt2) / (doubles.length - 1); // 计算百分位数
result = pa + ((target - a) / (c - a)) * (result - pa); // 插值计算百分位数
}
return result; // 返回百分位数
}
public static void main(String[] args) {
ArrayList<Double> dataList3 = com.google.common.collect.Lists.newArrayList(new Double("0.200010009"), new Double("0.300010009"), new Double("0.400010009"), new Double("0.500010009"), new Double("0.600010009"));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.200010009")));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.300010009")));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.400010009")));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.500010009")));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.600010009")));
}
Console:
dataList3_percentile: 0.0
dataList3_percentile: 0.25
dataList3_percentile: 0.5
dataList3_percentile: 0.75
dataList3_percentile: 1.0
这样其实已经达到我们想要的结果了,但是,如果我们是计算金融相关的数据,或者明确要求使用BigDecimal来处理数据,我们就得稍微改下上面的算法了。
public static BigDecimal getPercentile(List<BigDecimal> dataList, BigDecimal target) {
if (target == null) { // 如果目标值为空,则返回空
return null;
}
//升序排序
List<BigDecimal> bigDecimals = dataList.stream().sorted().collect(Collectors.toList()); // 对数据进行升序排序
if (bigDecimals.size() == 1) { // 如果数据只有一个元素,返回0
return BigDecimal.ZERO;
}
BigDecimal result; // 结果
int lt = 0; // 小于目标值的计数
int lt2 = 1; // 重复元素的计数
int pos = -1; // 目标值的位置
BigDecimal a = BigDecimal.ZERO; // a的值
BigDecimal c = BigDecimal.ZERO; // c的值
for (int i = 0; i < bigDecimals.size(); i++) { // 遍历数据
if (Objects.equals(bigDecimals.get(i), target)) { // 如果当前元素等于目标值
pos = i; // 记录目标值的位置
break;
} else if (bigDecimals.get(i).compareTo(target) < 0) { // 如果当前元素小于目标值
lt++; // 小于目标值的计数加一
if (Objects.equals(bigDecimals.get(i), a)) { // 如果当前元素等于a
lt2++; // 重复元素计数加一
} else {
lt2 = 1; // 重复元素计数重置为1
a = bigDecimals.get(i); // 更新a的值
}
} else { // 如果当前元素大于目标值
c = bigDecimals.get(i); // 更新c的值
break;
}
}
result = BigDecimal.valueOf((double) lt / (bigDecimals.size() - 1)); // 计算结果
if (pos < 0) { // 如果目标值不在数据中
BigDecimal pa = BigDecimal.valueOf((lt - lt2) / (bigDecimals.size() - 1)); // 计算pa
result = pa.add(target.subtract(a).multiply(c.subtract(a))).multiply(result.subtract(pa)); // 更新结果
}
return result; // 返回结果
}
为了验证结果是否一致,也方便对比,我把Double的结果和BigDecimal的计算结果,放到了一起输出;
public static void main(String[] args) {
ArrayList<Double> dataList3 = com.google.common.collect.Lists.newArrayList(new Double("0.200010009"), new Double("0.300010009"), new Double("0.400010009"), new Double("0.500010009"), new Double("0.600010009"));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.200010009")));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.300010009")));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.400010009")));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.500010009")));
System.out.println("dataList3_percentile: "+getPercentile(dataList3,new Double("0.600010009")));
ArrayList<BigDecimal> dataList4 = com.google.common.collect.Lists.newArrayList(new BigDecimal("0.200010009"), new BigDecimal("0.300010009"), new BigDecimal("0.400010009"), new BigDecimal("0.500010009"), new BigDecimal("0.600010009"));
System.out.println("dataList4_percentile: "+getPercentile(dataList4,new BigDecimal("0.200010009")));
System.out.println("dataList4_percentile: "+getPercentile(dataList4,new BigDecimal("0.300010009")));
System.out.println("dataList4_percentile: "+getPercentile(dataList4,new BigDecimal("0.400010009")));
System.out.println("dataList4_percentile: "+getPercentile(dataList4,new BigDecimal("0.500010009")));
System.out.println("dataList4_percentile: "+getPercentile(dataList4,new BigDecimal("0.600010009")));
}
Console:
dataList3_percentile: 0.0
dataList3_percentile: 0.25
dataList3_percentile: 0.5
dataList3_percentile: 0.75
dataList3_percentile: 1.0
dataList4_percentile: 0.0
dataList4_percentile: 0.25
dataList4_percentile: 0.5
dataList4_percentile: 0.75
dataList4_percentile: 1.0
一些大的工具类库应该是有支持这种计算的,但我还是想自己在本地写一个工具方法,毕竟到时候万一有问题改起来不是灵活一点么