Python基础(11)-- numpy.argpartition函数

news2025/1/15 22:59:04

1.前言

在深挖自己研究领域的代码过程中,发现np.argpartition函数出现在核心代码部分,并且出现的频率很高,对于我理解这段代码也有很大的帮助,决定彻底搞懂,话不多说,Let’s go!

2.函数解析

在最新版本的numpy 1.8中,是这样描述argpartition函数的。
在这里插入图片描述

大致意思是:沿着给定的维度(axis参数所决定)使用特定的算法(kind参数所决定)对输入a执行分区。函数的返回值是一个与输入a有着相同shape的索引,这个索引是根据分区的顺序和给定的维度进行分区得到的。

嗯……,不说是晦涩难懂吧,反正是不怎么好理解。没关系,让我们先看一下函数的各个参数具体代表什么含义,可能会帮助我们理解这个函数。
在这里插入图片描述

Input:a[array_like],很简单,代表我要对哪个array进行分区
kth:[int or int sequence]。比如kth=1,说明我要找最小的一个数,那么函数的返回值是最小的元素的索引;比如kth=3,那么函数的返回值是最小的3个元素的索引;kth=-2,说明函数的返回值是最大的2个元素的索引。
axis:维度,代表我要根据哪个维度进行分区,默认为-1,代表array的最后一个维度
kind:这是一个可选参数,默认为introselect,可以不用管,因为选项只有一个
order:是一个可选参数,用到的情况很少,这里不做解释

哦?看到这里,是不是对argpartition函数有一点感觉了,大致意思跟快速排序有点相似,但是argpartition函数返回的是索引,先选择好一个基准(kth决定),然后根据指定的维度(axis决定)对输入进行分区操作,所有小的数(序列a)放在前面,所有大的数(序列b)放在后面,然后返回新数组的索引。值得注意的是,序列a和序列b内部的顺序,我们是不予关注的,我们关注的是如何快速的找到最大或最小的几个数。
下面,我们通过多个案例理解argpartition函数的魔力。

3.案例分析

3.1 案例1-找出最小的三个元素

import numpy as np
x = np.array([5,6,1,2,4,-2,3])
print('Input array:',x)
y_index = np.argpartition(x, kth=3)  # 找出最小的三个元素,返回与输入相同size的array
print('Output:',x[y_index][:3])  # 取出最小的三个元素的值

在这里插入图片描述

3.2 案例2-找出倒数第2、倒数第3和倒数第4小的元素

import numpy as np
x = np.array([5,6,1,2,4,-2,3])
print('Input array:',x)
y_index = np.argpartition(x, kth=(1,4))  # 找出最小的三个元素,返回与输入相同size的array
print('Output:',x[y_index][1:4])  # 取出最小的三个元素的值

在这里插入图片描述

3.3 案例3-多维数据

import numpy as np
x = np.array([[5,6,1],[1,2,3]])
print('Input:\n{}'.format(x))
y_index_0 = np.argpartition(x, kth=1, axis=0)
print('Index array:\n',y_index_0)
y = np.take_along_axis(x, y_index_0, axis=0)
print('Output:\n', y)

在这里插入图片描述

3.4 案例4-多维数据

import numpy as np
x = np.array([[5,6,1],[1,2,3]])
print('Input:\n{}'.format(x))
y_index_1 = np.argpartition(x, kth=1, axis=1)
print('Index array:\n',y_index_1)
y = np.take_along_axis(x, y_index_1, axis=1)
print('Output:\n', y)

在这里插入图片描述

3.5 案例5-实际应用

以下摘自参考资料[3],该博主的解析十分浅显易懂,相信聪明的你们结合这2篇博客,定能将np.partition函数搞懂!
在这里插入图片描述
在这里插入图片描述

import numpy as np
import pandas as pd
from tqdm import tqdm

# generate sample data
n_features = 13426
n_disease = 425
features = [f"feature_{i}" for i in range(n_features)]
disease = [f"disease_{i}" for i in range(n_disease)]
weights = np.random.random((n_disease, n_features))


#function

def getdata(top_k: int) -> pd.DataFrame:
    index = np.argpartition(weights, -top_k, axis=1)[:, -top_k:]

    def slice_data(i):
        temp_data = pd.DataFrame({
            'features': np.array(features)[index[i, :]]})
        temp_data['disease'] = disease[i]
        temp_data['weights'] = weights[i, index[i, :]]
        return temp_data

    res = pd.concat([slice_data(i) for i in tqdm(range(weights.shape[0]))]).reset_index(drop=True)
    return res


final_data = getdata(top_k=3) # 这里只是找top3的,要是想找top10的,修改数值就行了
final_data.shape
final_data.head(4)

在这里插入图片描述

参考资料

[1]https://numpy.org/doc/stable/reference/generated/numpy.argpartition.html
[2]https://www.geeksforgeeks.org/numpy-argpartition-in-python/
[3]https://zhuanlan.zhihu.com/p/546886845

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1166615.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企业级API资产如何管理

在当今数字化时代,API已成为企业开发和创新的重要工具,如何高效地管理和调度这些资产成为了企业发展的重要课题。API资产管理的出现,为企业解决了这一难题,通过合理管理和利用API资产,企业可以更好地推动业务发展&…

vue工程化开发和脚手架

工程化开发和脚手架 1.开发Vue的两种方式 核心包传统开发模式:基于html / css / js 文件,直接引入核心包,开发 Vue。工程化开发模式:基于构建工具(例如:webpack)的环境中开发Vue。 工程化开…

漏洞复现--XXL-JOB默认accessToken身份绕过漏洞

免责声明: 文章中涉及的漏洞均已修复,敏感信息均已做打码处理,文章仅做经验分享用途,切勿当真,未授权的攻击属于非法行为!文章中敏感信息均已做多层打马处理。传播、利用本文章所提供的信息而造成的任何直…

视频剪辑合并攻略:随机封面,高效合并,轻松改标题

随着社交媒体的兴起,视频内容已经成为人们获取信息、娱乐和交流的重要方式。视频剪辑作为视频制作的关键步骤之一,不仅需要掌握技术,还需具备一定的创意和审美能力。在本文中,我们将分享云炫AI智剪实用的视频剪辑合并攻略&#xf…

甘特图组件DHTMLX Gantt用例 - 如何拆分任务和里程碑项目路线图

创建一致且引人注意的视觉样式是任何项目管理应用程序的重要要求,这就是为什么我们会在这个系列中继续探索DHTMLX Gantt图库的自定义。在本文中我们将考虑一个新的甘特图定制场景,DHTMLX Gantt组件如何创建一个项目路线图。 DHTMLX Gantt正式版下载 用…

【VR开发】【Unity】【VRTK】3-VR项目设置

任何VR避不开的步骤 如何设置VR项目,无论是PC VR还是安卓VR,我在不同的系列教程中都说过了,不过作为任何一个VR开发教程都难以避免的一环,本篇作为VRTK的开发教程还是对VR项目设置交代一下。 准备好你的硬件 头盔必须是6DoF的,推荐Oculus Quest系列,Rift系列,HTC和Pi…

什么样的耳机适合跑步?适合跑步佩戴的无线耳机推荐

​无论是在烈日炎炎的夏天,还是在寒风刺骨的冬天里健身运动,只要打开音乐就能沉浸其中。运动耳机不仅佩戴稳固舒适,还能提供高品质音质表现。无论在哪里,无论何时,只要打开音乐,你就可以找到你的节奏&#…

双十一买电视盒子什么牌子好?拆机达人强推目前性能最好的电视盒子

我这几年拆过的电视盒子已经有40多款了,最近看到网友们在讨论双十一电视盒子怎么挑选,就我拆机的经验来说,有些产品在硬件上存在问题的确较多,不知道双十一买电视盒子什么牌子好,可以参考我整理的目前性能最好的电视盒…

【2023-10-31】某钩招聘网站加密参数分析

声明:该专栏涉及的所有案例均为学习使用,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!如有侵权,请私信联系本人删帖! 文章目录 一、前言二、网站分析1.X-S-HEADER参数2.请求参数data3.响应机密值data一、前言 网址: aHR0cHM6Ly93d3cubGFnb3UuY29t…

JavaScript引擎和运行时

什么是一个JavaScript引擎 JS引擎 执行JS代码的程序 例如比较出名的就是GOOGLE的V8引擎,当然其他浏览器也有各自的引擎 JS引擎一般会有两部分组成,一个是调用栈,一个是堆; 调用栈就是我们代码实际执行的地方,而堆是…

云DR数据、应用程序和硬件的紧急备份恢复

云很方便,但是需要做好紧急备份恢复工作。 什么是云容灾(Cloud DR)? 云灾难恢复或简称云 DR 是指数据、应用程序和硬件的紧急备份策略,与传统方法不同,它依赖于云中的存储。 发生故障时,受影响的数据、应用程序和其他资源可以一键从云端恢复,以便尽快恢复业务。 服务提…

BIOS开发笔记 - CMOS

CMOS原来指的是一种生产电子电路的工艺,在PC上一般指的是RTC电路单元,因为早期它是由这种工艺生产出来的,所以又把RTC称作了CMOS。 RTC(Real Time Clock)即实时时钟,用于保存记录时间和日期,也可以用来做定时开机功能。RTC靠一组独立的电源给它供电,这样设计的目的就是…

【音视频 | Ogg】libogg库详解介绍以及使用——附带libogg库解析.opus文件的C源码

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀 🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C、数据结构、音视频🍭 🤣本文内容🤣&a…

Charles小白新手入门教程

最近系统地重温了下Charles的各种功能,根据小破站上百里老师的讲解,做了一些笔记,对于Charles入门小白,多少会有点帮助, 下面就把分享给大家~ 一、Charles介绍 1、Charles简介 是基于http和https的代理服务器。 2、…

【windows Docker镜像占用许多空间:将数据迁移到D盘】

查看其占据的空间 导出数据到D盘 首先退出docker C:\Users\lxh>wsl --shutdownC:\Users\lxh> C:\Users\lxh>wsl --export docker-desktop-data docker-desktop-data.tar 正在导出,这可能需要几分钟时间。 操作成功完成。C:\Users\lxh> C:\Users\lxh&g…

探讨安科瑞智慧型动态无功补偿的工业应用-安科瑞 蒋静

摘要:低压配电系统的无功补偿是电能质量治理的重要环节。在传统无功补偿中,响应速度较慢,补偿电流呈阶梯式,存在过补或欠补的现象,有时未必能到达理想的效果。为了解决这一问题,人们提出了一种无功补偿综合…

三篇文章了解计算机网络(小白篇)

目标 三篇文章(小白,入门,进阶),由浅入深理解计算机网络 适宜人群 小小白、无计算机网络基础,非技术人员,网络兴趣爱好者 内容简介 本文不谈技术,不谈理论,通过我们…

Sulfo-CY5 NHS荧光染料的生物应用2230212-27-6星戈瑞

Sulfo-CY5 NHS ester是一种用于生物学和生物医学研究中的荧光染料,它在生物应用方面具有许多重要用途,包括但不限于以下几个方面: **生物标记:**Sulfo-CY5 NHS ester可以与生物分子(如抗体、蛋白质、核酸等&#xff09…

【Python Numpy】修改数组形状

文章目录 前言一、什么是NumPy数组形状?二、NumPy改变数组形状的方法2.1 reshape方法2.2 resize方法2.3 flatten方法2.4 ravel方法2.5 transpose方法 三、关于修改数组形状更多的示例代码总结 前言 NumPy(Numerical Python)是Python中用于处…