python知识记录:灵活使用numpy提高python数据分析效率!

news2025/1/9 2:52:48

NumPy是Python语言的一个第三方库,其支持大量高维度数组与矩阵运算。

作为python科学计算领域的三剑客之一,numpy在数据分析处理方面有着独特的魅力!

图.png

numpy模块的出现更多的是在数组处理的操作上面,并且支持和python常用的数据结构list之间的相互转换操作。

1、数组初始化

数组初始化即创建数组,numpy提供了相当多的创建不同结构的数组的方式,合理的利用这些数据初始化的操作能够让我们的开发事半功倍。

numpy目前最多可以支持三维数组的创建,下面我们直接通过实例来说明其使用技巧。

# 导入数据处理的numpy模块
import numpy as np

# 通过python列表list创建numpy一维数组
array_ = np.array(['a', 'b', 'c'])

# 控制台打印一维数组
print(array_)
# ['a' 'b' 'c']

# 通过python列表list创建numpy二维数组
array_ = np.array([('a', 'b', 'c'), (1, 2, 3)])

# 控制台打印二维数组
print(array_)
# [['a' 'b' 'c']
#  ['1' '2' '3']]

# 创建四行五列的二维数组,并填充值为1,可通过full函数创建任意的二维数组
array_ = np.full((5, 6), 1)

# 控制台打印任意的行、列的二维数组
print(array_)
# [[1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]]

# 创建任意行、列的二维数组,并且填充值为随机数
array_ = np.random.rand(3, 4)

# 控制台打印随机数的二维数组
print(array_)
# [[0.94372258 0.66743021 0.47003813 0.44912263]
#  [0.71435389 0.47909147 0.52322176 0.32445311]
#  [0.9843635  0.14054129 0.10611754 0.45922036]]

上述便是常用的numpy模块关于数组的初始化方式,灵活应用几种array数组的创建方式能够解决在业务开发过程中的很多问题。

2、数组元素计算

除了numpy的数组的初始化方式,关于numpy数据元素的计算是开发过程中常常会使用的计算方式。

numpy模块提供的很多计算函数不仅简便,而且执行效率更高。有时候比我们自己写的函数运行速度甚至高出几倍不止。

下面就来看看在日常的数据处理过程中常用的几种数据处理函数的使用过程。

# array函数初始化多维度数组
array_ = np.array([(1, 2),
                   (3, 4), (5, 6)])

# sum函数计算多维度数组每一列的和
sum_ = np.sum(array_)

# 打印数组计算结果
print(sum_)
# 21

# mean函数计算多维度数组的平均值
mean_ = np.mean(array_)

# 打印数组计算结果
print(mean_)
# 3.5

# tile函数使元数组变成多行多列的形式,相当于复制的效果
tile_ = np.tile(array_, (3, 4))

# 打印计算结果
print(tile_)
# [[1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]
#  [1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]
#  [1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]]

# 初始化二维数组
array_ = np.array([[3, 6, 4, 11],
                   [5, 10, 1, 3]])

# argsort函数完成对数组的排序操作
argsort_ = array_.argsort()

# 打印计算结果
print(argsort_)
# [[0 2 1 3]
#  [2 3 0 1]]

# argsort函数完成对数组列值的排序操作
argsort_ = array_.argsort(axis=0)

# 打印计算结果
print(argsort_)
# [[0 0 1 1]
#  [1 1 0 0]]

注意:上述的排序结果返回的是源数组的排序后的下标。

除了上述的numpy数组计算的基本操作,最常用的就是下面的numpy数组的加、减、乘、除计算。

通过数组的加、减、乘、除计算能够满足我们在业务开发过程中的绝大多数的计算操作。

# 初始化两个数组a_、b_分别用于下面的逻辑计算
a_ = np.array([1, 2, 3, 4])
b_ = np.array([5, 6, 7, 8])

# 计算两个一维数组的和
result_ = a_ + b_

# 打印计算结果
print(result_)
# [ 6  8 10 12]

# 计算两个一维数组的差
result_ = a_ - b_

# 打印计算结果
print(result_)
# [-4 -4 -4 -4]

# 计算两个一维数组的乘积
result_ = a_ * b_

# 打印计算结果
print(result_)
# [ 5 12 21 32]

# 计算两个一维数组的商
result_ = a_ / b_

# 打印计算结果
print(result_)
# [0.2        0.33333333 0.42857143 0.5       ]

除了上述的一维数组的相关计算,同时numpy还可支持二维矩阵的逻辑计算。

3、数组元素提取

数组元素的提取其实主要还是对数组的下标索引的相关操作。

numpy提供的多维数组同样能够使用对应的索引位置提取出相应的值。

# 初始化二维数组
array_ = np.array([[3, 6, 4, 11],
                   [5, 10, 1, 3]])

# 提取第二行、第四列的值
value_ = array_[1, 3]

# 打印计算结果
print(value_)
# 3

# 提取出倒数第二行、第三列到第四列之间的二维数组
value_ = array_[-2:, 2:3]

# 打印计算结果
print(value_)
# [[4]
#  [1]]

# 获取数组中大于、小于、等于某个数值的结果
result_ = array_ >= 10

# 打印计算结果
print(result_)
# [[False False False  True]
#  [False  True False False]]

# 返回的数组中,所在位置为True的数值就是符合逻辑计算的数值。

多维数组的索引的数值提取操作,能够辅助我们完成更加复杂的数据处理操作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/417718.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Transformer在时序预测的应⽤第一弹——Autoformer

Transformer在时序预测的应⽤第一弹——Autoformer 原文地址:Autoformer: Decomposition Transformers with Auto-Correlation for Long-Term Series Forecasting(NIPS 2021) 做长时间序列的预测 Decomposition把时间序列做拆分&#xff0c…

目标检测——YOLOv7(十三)

简介: 继美团发布YOLOV6之后,YOLO系列原作者也发布了YOLOV7。主要从两点进行模型的优化:模型结构重参化和动态标签分配。 YOLOv7的特点是快!相同体量下比YOLOv5精度更高,速度快120%,比YOLOX快180%。 Github…

RabbitMQ消息丢失的情况,以及如何通过代码解决

目录 RabbitMQ消息丢失问题: 代码部分: 完整代码: RabitMQConfig: CourseMQListener: 生产者跟交换机通信的消息丢失解决 : 交换机跟消息队列的消息丢失: 消息队列跟消费者的消息丢失: …

自动处理【支付宝交易支付投诉管理系统】配置指南

大家好,我是小悟 已经有小伙伴开始使用自动处理【支付宝交易支付投诉管理系统】,所以详细介绍一下如何配置。 阅读这篇文章之前,结合这篇【连夜干出来一个自动处理【支付宝交易支付投诉管理系统】,支持多商户】干货食用更佳。 连…

Filter 过滤器 Listener 监听器

Filter web中的过滤器当用户访问服务器资源时,过滤器将请求拦截下来,完成一些通用的操作应用场景如:登录验证、统一编码处理、敏感字符过滤 编写filter对目标资源servlet进行拦截 1. 编写java类,实现filter接口 public class Qu…

智慧医院人员定位系统解决方案,助力医院安全管理智能化

随着经济的发展与生活质量的提升,人们对医疗健康的重视度越来越高,医疗行业也因此蓬勃发展起来。然而,不断扩大的经营规模也给医院安全管理带来挑战和难题。 医院安全管理痛点 1、医疗事件信息获取不及时甚至存在瞒报现象,管理者…

yc博客项目创建-白手起家

初始化项目 1、码云创建代码库 2、下载码云项目到本地 3、IDEA直接生成springboot项目 接入mysql 1、配置文件 2、代码配置 启动项目 访问项目 访问连接: http://localhost:8089/yc-blog/index/listlistContent 注意点:server.servlet.context-path…

Redis用于全局ID生成器、分布式锁的解决方案

全局ID生成器 每个店铺都可以发布优惠卷 当用户抢购时,就会生成订单并保存到tb_voucher_order这张表中,而订单表如果使用数据库自增id就存在一些问题: 1.id的规律性太明显 2.受单表数据量的限制 全局ID生成器,是一种在分布式系…

极光笔记 | 如何在Shopify中使用EngageLab (下)

Sendgird发布的《2022 Global Messaging Engagement Report》中揭示了世界各地的用户更喜欢用哪种方式与品牌互动,结论是:“电子邮件仍然是第一名(短信紧随其后)”。4800多名受访者中,有18%的人将电子邮件列为他们最常…

普通人是否能从ChatGPT中分一杯羹?

ChatGPT3.0刚刚推出,最开始的时候,人们只是将ChatGPT看作一个很会聊天的机器人,无论问题多么天马行空,它的答案看上去都有理有据。后来,像打开潘多拉魔盒一样,很多人开始拿它编大纲、撰写文案、编代码、创作…

Docker本地推送到hub,以及上传时遇到的问题解决

1.在本地创建一个 Dockerfile FROM ubuntu:latest RUN apt-get update && apt-get install -y curl CMD ["curl", "https://www.baidu.com"]2.在本地构建 Docker 镜像 在创建本地docker镜像的时候[TAG] .和[TAG] /PATH/TO 需要注意dockerfile文件…

ATTCK v12版本战术介绍——防御规避(二)

一、引言 在前几期文章中我们介绍了ATT&CK中侦察、资源开发、初始访问、执行、持久化、提权战术、防御规避(一)理论知识及实战研究,本期我们为大家介绍ATT&CK 14项战术中防御规避战术(二),包括防御…

【数据结构】顺序栈和链栈的基本操作(定义,初始化, 入栈,出栈,取栈顶元素,遍历,置空)

🎊专栏【数据结构】 🍔喜欢的诗句:更喜岷山千里雪 三军过后尽开颜。 🎆音乐分享【勋章】 大一同学小吉,欢迎并且感谢大家指出我的问题🥰 目录 ⭐栈的分类 ✨顺序栈 🎈优点: &…

离线安装k8sv1.20.5版本并部署服务

注意:我这里的离线安装包是V1.20.5的,单安装一个master节点并部署服务,保证可以使用。如果安装集群也是可以的,但是需要把离线包上传到所有的node节点,导入,最后把node节点接入到K8S集群即可,本…

js flyout 2: VScroll

目录版权描述测试页面showFlyout问题1 - scroll 实现可能不准?问题2 - 容器内容重排可导致浮层错位关于重排小结附录 - 完整代码版权 本文为原创, 遵循 CC 4.0 BY-SA 版权协议, 转载需注明出处: https://blog.csdn.net/big_cheng/article/details/130101031. 文中代码属于 pu…

【致敬未来的攻城狮计划】学习总结

文章目录【致敬未来的攻城狮计划】学习总结前言学习总结一、RT-Thread二、RA2E1开发板三、学习移植RT-Thread四、学习RT-Thread设备五、其他收获六、总结【致敬未来的攻城狮计划】学习总结 🚀🚀开启攻城狮的成长之旅!这是我参与的由 CSDN博客…

【RabbitMQ学习日记】——死信队列与延迟队列

一、死信队列 1.1 相关概念 死信,顾名思义就是无法被消费的消息,字面意思可以这样理解,一般来说,producer 将消息投递到 broker 或者直接到 queue 里了,consumer 从 queue 取出消息进行消费,但某些时候由…

云擎未来,智信天下 | 2023移动云大会来了!

新三年,新征程 2023年作为新三年开局之年 移动云又将以怎样的 全新品牌形象、全新战略规划 向“一流云服务商”战略目标勇毅前行? 答案就在这里: 2023移动云大会,官宣定档! 2023.4.25 - 4.26 苏州金鸡湖国际会…

MATLAB配置C/C++库(Visual Studio,MinGW-w64 C/C++ 编译器)问题(包括低版本matlab配置高版本VS)

问题描述 使用matlab加载C语言的库函数时,需要提前配置好C/C编译器,否则在matlab中使用 loadlibrary 加载C /C库中的函数时候,会报错: “未找到支持的编译器或 SDK。您可以安装免费提供的 MinGW-w64 C/C 编译器;请参…

软考第三章 广域通信网

广域通信网 1.公共交换电话网 公共交换电话网PSTN:是为了话音通信而建立的网络,在有些地方用户仍然通过电话线拨号上网 1.1 电话系统的结构 电话系统是一个高度冗余的分级网络。用户电话通过一对铜线连接到最近的端局。 公共电话网由本地网和长途网组…