从平均数到排名算法

news2025/1/10 23:48:34

平均数用更少的数字,概括一组数字。属于概述统计量、集中趋势测度、位置测度。中位数是第二常见的概述统计量。许多情况下比均值更合适。算术平均数是3中毕达哥拉斯平均数之一,另外两种毕达哥拉斯平均数是几何平均数和调和平均数。

算术平均

A M = 1 n ∑ i = 1 n x i AM = \frac{1}{n}\sum_{i=1}^n x_i AM=n1i=1nxi

几何平均

G M = ( ∏ i n x i ) 1 n GM = (\prod_i^n x_i)^{\frac{1}{n}} GM=(inxi)n1

可以通过面积/体积运算来理解几何平均:两个实数a,b分别对应长方形的边和宽,则实数a,b的几何平均等于这样一个正方形的边长,这个正方形的面积与a、b组成的长方形的面积相等。

更多维度情况下类似。

调和平均

H M = n ∑ i = 1 n 1 x i HM = \frac{n}{\sum_{i=1}^n\frac{1}{x_i}} HM=i=1nxi1n

两点间包含 n 段长度相同的路程,每段路程采用不同的速度 x i x_i xi完成,完成所有路程的平均速度就是x_i的调和平均。

平方平均数

Q M = 1 n ∑ i = 1 n x i 2 QM = \sqrt{\frac{1}{n}\sum_{i=1}^nx_i^2} QM=n1i=1nxi2

平均数之间的关系

H M ≤ G M ≤ A M ≤ Q M HM \le GM \le AM \le QM HMGMAMQM

关系的几何证明:

请添加图片描述

排名算法

排名问题形式简单,也就是将一组对象根据其重要性加以排序,但其解答往往不是那么简单的,充满了悖论和谜题。目前看来排名问题吸引了越来越多的人的研究兴趣,原因可能包括信息量的指数增长,数据收集能力的增强。排名的对象五花八门,比如网页、视频、直播、新闻、股票、球队等等。

排名聚合的目的是通过某种算法将多个排名结果加以融合,产出最终的单一的更好的排名结果。平均法是比较常见的排名聚合的方法,下面讨论采用不同的均值算法对排名结果的影响。

  • 调和平均:
    • H M = 2 1 / x + 1 / y , ∂ H M ∂ x = 2 ( 1 1 + x / y ) 2 , ∂ H M ∂ y = 2 ( 1 1 + y / x ) 2 HM = \frac{2}{1/x+1/y},\frac{\partial HM}{\partial x} = 2(\frac{1}{1 + x/y})^2,\frac{\partial HM}{\partial y} = 2(\frac{1}{1 + y/x})^2 HM=1/x+1/y2,xHM=2(1+x/y1)2,yHM=2(1+y/x1)2
    • 自变量x, y中较小者的导数较大,平均值结果受到较小值的影响较大
  • 几何平均数
    • G M = x y , ∂ G M ∂ x = 1 2 y x , ∂ G M ∂ y = 1 2 x y GM = \sqrt{xy},\frac{\partial GM}{\partial x} = \frac{1}{2}\sqrt{\frac{y}{x}}, \frac{\partial GM}{\partial y} = \frac{1}{2}\sqrt{\frac{x}{y}} GM=xy ,xGM=21xy ,yGM=21yx
    • 自变量x, y中较小者的导数较大,且在接近零的时候导数趋向无穷大,因此几何平均数在零附近的极小值极为敏感。
  • 算术平均数
    • A M = x + y 2 , ∂ A M ∂ x = 0.5 , ∂ A M ∂ y = 0.5 AM = \frac{x+y}{2},\frac{\partial AM}{\partial x} = 0.5, \frac{\partial AM}{\partial y} = 0.5 AM=2x+y,xAM=0.5,yAM=0.5
    • 自变量x, y导数恒定不变,不偏袒较小值和较大值
  • 平方平均数
    • Q M = x 2 + y 2 2 , ∂ Q M ∂ x = 2 1 + ( y / x ) 2 , ∂ Q M ∂ y = 2 1 + ( x / y ) 2 QM = \sqrt{\frac{x^2+y^2}{2}},\frac{\partial QM}{\partial x} = \sqrt{\frac{2}{1 + (y/x)^2}}, \frac{\partial QM}{\partial y} = \sqrt{\frac{2}{1 + (x/y)^2}} QM=2x2+y2 ,xQM=1+(y/x)22 ,yQM=1+(x/y)22
    • 自变量x, y中较大者的导数较大,平均值受较大值的影响较大

例子:考虑 x , y ∈ ( 0 , 1 ) x,y\in(0,1) x,y(0,1), 且固定 y = 0.8,观测均值随x的变化趋势(黑色:QM,橘色:AM,红色:GM,蓝色:HM)

  • x ∈ ( 0 , 0.2 ) x \in (0, 0.2) x(0,0.2) ,随着x的增大,平方平均数几乎持平,算术平均数已0.5的恒定速度增长,几何平均数增长速度最大,调和平均数增长速度紧次于几何平均数;在 x 远小于 y 的区域,平方平均数几乎不受x变化的影响,算术平均值以恒定的0.5的比例受到x变化的影响,几何平均数以远大于0.5的比例受x变化的影响,调和平均数的影响比例介于几何平均数和算术平均数之间。
  • x ∈ ( 0.2 , 0.8 ) x\in(0.2, 0.8) x(0.2,0.8),随着 x 的继续增大,对平方平均数的影响逐渐递增,算术平均数的变化率依旧不变,几何平均数从左侧接近0.5,调和平均数与几何平均数类似
  • x ∈ ( 0.8 , 1.0 ) x\in(0.8,1.0) x(0.8,1.0),随着 x 的继续增大,对平方平均数的影响继续递增,超过所有其他平均数,算术平均的变化率依然保持恒定,几何平均数变化率下降到0.5以下,但高于调和平均数。

请添加图片描述

因此在对具有多个排序属性值的对象继续排序

  • 算术平均值对多属性值的量纲不敏感,选取的对象可能是个别属性特长的,也可以是综合能力(不存在短板属性)都不错的
  • 几何平均和调和平均值对较小属性值敏感,如果对象存在短板属性,则整体排名不会太高,因此选出来的对象倾向于综合能力不错,不存在明显短板的内容
  • 平方平均值对较大值比较敏感,因此选出的内容倾向于某些熟悉特长的对象,存不存在短板影响不是很大

上文的分析对设计排名算法的启发是:

  • 多个属性缺一不可,不能有短板的情况下,适宜几何平均数和调和调和平均数:比如信息检索中的指标f1,是模型查准率precision和查全率recall的调和平均数,原因是一个有使用价值的模型,不能存在明显的偏科,大部分情况下precision = 0.9, recal = 0.1的模型,不如precisio = 0.6,recall = 0.6的模型,查准率查全率太小的模不具有实用价值。几何平均和调和平均排名中,值域小的属性对结果的影响较大,值域大的熟悉对结果影响较小,一点层度上有些反直觉
  • 容许多个属性出现某些短板,适宜算术平均值:比如一般的考试成绩汇总,采用的是加法求和,其实等价于算术平均,算术平均允许某些科目有短板,只要考生有另外一些特长科目,整体排名也会不错,又或则考试没有明显的特长,但也没有明显的短板,排名也会不错。
  • 平方平均数鼓励特长,惩罚中庸,与几何平均和调和平均相对的另一个极端。

几个属性值同分布的情况下,几类排序算法是等价的。但拉齐分布的隐射过程,可能会导致失去了原始值的信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1035712.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Netty简介及简单客户端/服务端示例代码

什么是Netty? Netty是一个NIO客户机-服务器框架,它支持快速而容易地开发网络应用程序,如协议服务器和客户机。它大大简化和简化了网络编程,如TCP和UDP套接字服务器。 “快速简单”并不意味着生成的应用程序将遭受可维护性或性能问…

pycharm 让控制台里的链接可以点击

前言 如果细心就会发现pychram控制台里一些链接是可以点击的,另外一些不行,那么如果让输出的链接可以点击如何做呢? 解决 输出的i链接会在控制台里可以点击,并且点击会在本地直接打开 如果打印的是网址则可以直接点击 print(file:///{}.format(i))print(https://www.baid…

[架构之路-220]:与机器打交道VS与人打交道,计算机系统VS人体系统,计算机网络VS人类社会:架构、通信、语言、网络、智能、情感、生命

目录 前言: 一、计算机系统架构 VS 人体系统架构 1.1 相似之处 1.2 不同之处 1.3 人的心理与计算机软件 1.4 计算机系统层次 VS 人的层次模型 二、计算机通信 VS 人与人交流 2.1 计算机通信communication 2.2 人与人的交流communication 2.3 智商 VS 情商…

mybatis拦截器执行原理

title: “mybatis拦截器执行过程” createTime: 2021-12-08T12:19:5708:00 updateTime: 2021-12-08T12:19:5708:00 draft: false author: “ggball” tags: [“mybatis”] categories: [“java”] description: “mybatis拦截器执行过程” m[toc] mybatis的拦截器本人平时也很…

【数据结构】链表--单链表

目录 一 概念及结构 二 单链表的实现 1 包含接口(SList.h) 2 打印和创造节点(扩容)(SList.c) 3 尾插(SList.c) 4 头插(SList.c) 5 尾删(SList.c) 6 头删(SList.c) 7 在pos前插入x&…

大数据从入门到精通(超详细版)之Hive的案例实战,ETL数据清洗!!!

前言 嗨,各位小伙伴,恭喜大家学习到这里,不知道关于大数据前面的知识遗忘程度怎么样了,又或者是对大数据后面的知识是否感兴趣,本文是《大数据从入门到精通(超详细版)》的一部分,小…

安全生产知识竞赛活动小程序界面分享

安全生产知识竞赛活动小程序界面分享

SCR截面速度、氨氮比等标准及相对标准偏差计算

SCR截面速度、氨氮比等标准及相对标准偏差计算 # -*- coding: utf-8 -*- """ 联系QQ:3123575367,专业SCR脱硝仿真。 Created on Wed Sep 20 20:40:30 2023 该程序用来处理fluent通过xyplot导出的数据,可计算标准偏差SD、相对标准偏差RSD…

linux 安装 wordpress

文章目录 linux 安装 wordpress1. wordpress 简介2. wordpress功能和特点3. 部署要求4. 环境搭建4.1 部署 nginx4.1.1 新增配置文件 4.2 部署 PHP74.2.1 查看当前版本4.2.2 YUM 安装 PHP74.2.3 查看 PHP 版本4.2.4 启动PHP-FPM4.2.5 修改配置文件4.2.6 重启服务 4.3 部署 mysql…

Spring事务2+银行转账拓展

前言 Transactional()内可以写的属性 一、Dao层的更新 public interface LogDao {//#{}符号取的是接口方法中的形参 now()方法直接调用的内置函数Insert("insert into log (info,createDate) values(#{info},now())")void log(String info); }二、LogService层…

【Element】通知 Notification

ElementUI 弹出通知 created() {const h this.$createElementconst that thisthis.$notify({onClose: function () {that.do()},type: warning,duration: 5000, // 5秒后隐藏offset: 0, // 距离顶部dangerouslyUseHTMLString: false, showClose: false,customClass: notify-…

索引(含B树、B+树)

1、索引(index) 索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。 一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。 索引相当于一本书的目录,是为了缩小扫描…

Nginx 防止跨站脚本 Cross-Site Scripting (XSS)

1、修改 nginx 配置 在 nginx.conf 配置文件中,增加如下配置内容: add_header X-XSS-Protection "1; modeblock";X-XSS-Protection 的字段有三个可选配置值,说明如下: 0: 表示关闭浏览器的XSS防护机制&…

计算机专业毕业设计项目推荐08-英语在线点读平台(SpringBoot+Vue+MongoDB)

英语在线点读平台(SpringBootVueMongoDB) **介绍****系统总体开发情况-功能模块****各部分模块实现** 介绍 本系列(后期可能博主会统一为专栏)博文献给即将毕业的计算机专业同学们,因为博主自身本科和硕士也是科班出生,所以也比较了解计算机专业的毕业设…

华为认证HCIP知识点

文章目录 前言考试内容数据通信领域各场景通用核心知识OSPFIS-ISBGPIGMPICMP 数据通信领域路由交换高阶知识大数据技术Hadoop 总结 前言 本博客仅做学习笔记,如有侵权,联系后即刻更改 科普: 考试内容 参考网址 HCIP认证主要定位于中小型网…

Spring面试题7:面试官:Spring是如何进行异常处理的呢?

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:Spring是如何进行异常处理的呢? Spring通过异常处理机制来处理应用程序中的异常。它提供了多种方式来处理异常,包括以下几种: 声明式事务管理:…

实战案例:场景测试之ATM机取款业务测试

本期,我们通过经典案例——ATM机的操作,来为大家详细说说如何撰写对应的测试用例。 案例 在我们日常生活中,ATM机是个大家都非常熟悉的事物。银行为例提高工作效率,方便客户随时办理基础的储蓄和提现业务,于是&#…

Qt5开发及实例V2.0-第二十章-Qt.QML动画特效

Qt5开发及实例V2.0-第二十章-Qt.QML动画特效 第20章 QML动画特效20.1 QML动画元素20.1.1 PropertyAnimation元素20.1.2 其他动画元素20.1.3 Animator元素 20.2 动画流UI界面20.2.1 状态和切换 20.3 图像特效20.3.1 3D旋转20.3.2 色彩处理 20.4 Qt 5.5(Qt Quick Extr…

web前端float布局、flex布局

1、float布局 <!DOCTYPE html> <html> <head><title>Login Page</title><style>body {font-family: Arial, sans-serif;background-color: #f3f3f3;}.container {max-width: 400px;margin: 0 auto;padding: 40px;background-color: #fff;…