【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一

news2025/1/13 15:52:05

知识目录

  • 前言
  • 一、NumPy介绍
    • 1.1 导入NumPy库
    • 1.2 查看NumPy版本
    • 1.3 读取图片返回NumPy数组
  • 二、创建NumPy数组的十二种方式
    • 2.1 array 和 full
    • 2.2 zeros 和 ones
    • 2.3 随机数数组
    • 2.4 服从正态分布的数组
    • 2.5 arrange 和 eye、linspace
  • 三、ndarray属性
  • 四、ndarray基本操作
    • 4.1 索引
    • 4.2 切片
        • 一维数组
        • 二维数组
  • 五、实例 - 图片翻转
  • 六、变形
  • 七、合并与拆分
    • 7.1 合并
    • 7.2 拆分
  • 八、数组拷贝
  • 结语
  • 相关导读

前言

大家好!我是初心,本期给大家带来的是【数据分析 - 基础入门之NumPy④】NumPy基本操作(广泛)。

作者的【 Python 数据分析】专栏正在火热更新中,如果本文对您有帮助,欢迎大家点赞 + 评论 + 收藏 !

每日金句分享:选择你所喜欢的,爱你所选择的。』—— 托尔斯泰「托尔斯泰

一、NumPy介绍

NumPy( Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

NumPy主要用于数组计算,包含
一个强大的N维数组对象 ndarray
广播功能函数
整合 C/C++/Fortran 代码的工具
线性代数、傅里叶变换、随机数生成等功能

1.1 导入NumPy库

导入 NumPy 库是我们的第一步准备工作。在此,还一并导入了以后会用到的 Pandas 库、 MatplotLib 库的 pyplot 模块。

# 导入数据分析 ‘三剑客’
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt

1.2 查看NumPy版本

# 注意左右都是双下划线 ~ ~
np.__version__

1.3 读取图片返回NumPy数组

通过 pyplot 读取到的图片,返回的就是一个 NumPy 数组。

这是我事先准备好的一张图片 —— tangsan.jpg:

接下来通过 plt 对象读取:

n = plt.imread('pic\\tangsan.jpg')
n

输出过多,这里只展示首尾:



查看数组形状:

n.shape

再次显示图片:

plt.imshow(n)

二、创建NumPy数组的十二种方式

2.1 array 和 full

array 函数用法:numpy.array(object, dtype=None),object 可以为单个值、元组、列表、多维可迭代对象等可迭代对象,作用是创建数组。

list_one = [1,2,3,4]
# 列表创建
n1 = np.array(list_one)
tuple_one = (1,3,2)
# 元组创建
n2 = np.array(tuple_one,dtype=np.int16)
display(n1,n2)

下面是运行结果:

full 函数用法:numpy.full(shape, fill_value, dtype=None),shape 是数组形状(可以理解为几维几列,一般以元组形式给出),fill_value 是填充的值,dtype 是类型,作用是创建一个值全为同一个的数组。

# 创建一个二维三列的数组
n2 = np.full(shape=(2,3),fill_value=1,dtype=np.int16)
n2

2.2 zeros 和 ones

zeros 函数用法:zeros(shape, dtype=float, order=‘C’),返回一个给定形状和类型的用0填充的数组。

n3 = np.zeros((3,3))
n3

ones 函数用法:np.ones(shape, dtype=None, order=‘C’),返回一个指定形状和类型的用1填充的数组。

n4 = np.ones((3,2),dtype=np.float)
n4

2.3 随机数数组

randint 函数用法:randint(low, high=None, size=None, dtype=‘l’),low 为随机数最小值,high 为最大值(取不到),size 在这里等价于 shape ,返回一个指定维度且元素位于 low~high 之间的随机数组。

n5 = np.random.randint(1,10,(3,4))
n5

random 函数用法:random(size),size 等价于 shape ,为行列数,返回一个0~1之间指定形状的数组。

n6 = np.random.random((4,2))
n6

rand 函数用法:rand(d0, d1, …, dn),d0,d1,dn 分别表示1~n个维度的维数,返回一个0-1之间指定维度的数组,区别于 random 的是,这个函数传参不能传入带 ()的元组。

n7 = np.random.rand(3,3)
n7

2.4 服从正态分布的数组

randn() 函数用法:randn(d0, d1, …, dn),创建一个服从标准正态分布(X ~ N(0,1))的多维数组。也就是说,产生的数据大部分生成在0左右。

n8 = np.random.randn(2,3)
n8

normal()函数用法:normal(loc=0.0, scale=1.0, size=None),loc 表示均值,scale 表示标准差,size等价于 shape ,创建一个服从正态分布的多维数组。

n9 = np.random.normal(1,2,(2,3))
n9

2.5 arrange 和 eye、linspace

eye()函数用法:np.eye(N, M=None, k=0, dtype=<class ‘float’>, order=‘C’),N 是行数,M 是列数,K 是偏移量,创建一个单位矩阵数组。

n10 = np.eye(5,5)
n10

linspace()函数用法:np.linspace(start,stop,num),创建一个包含 num 个数的等差数列,公差 d 等于多少由系统计算。

n11 = np.linspace(1,20,3)
n11

arrange()函数用法:arange([start,] stop[, step,], dtype=None),start 为起始数,stop 为结束数,创建一个连续的一维数组。

n12 = np.arange(1,10,dtype=np.int16)
n12

三、ndarray属性

维度:ndim ,直接返回维度数
形状:shape,数字有几个就表示几维数组
总长度:size,返回总数据量
元素类型:dtype

n1 = np.random.randint(1,10,(3,5))
display(n1)
print("维度:%d,形状:%s,总长度:%s,元素类型:%s"%(n1.ndim,n1.shape,n1.size,n1.dtype))

四、ndarray基本操作

4.1 索引

在 ndarray 数组中,索引的使用有两种等价方式,即 n [M,N] = n [M][N],M表示第一个维度,N表示第二个维度,若不止二维,以此类推,n[M,N,P,……]。

n1 = np.random.randint(1,10,(3,5))
print(n1)
print("n1[2,3]=%s,n1[2][3]=%s"%(n1[2,3],n1[2][3]))

4.2 切片

切片包括行、列切片,可以实现取连续或不连续的行或列,也可以复制、翻转数组,如果是:, 的写法,表示第一个维度全取,并且,切片操作都是左闭右开。

一维数组

  • <1> 一个参数:a[i],返回一个数
  • <2> 两个参数:a[start:stop],对数组进行切片
  • <3>三个参数:a[start,stop,step],对数组进行切片,step 为步长,当 step = -1 时表示翻转。

二维数组

  • <1> 取元素:a[i,j],返回第 i 行的第 j 个数
  • <2> 切片:a[xi:xj,yi:yj],返回第 xi ~ xj 行的第 yi ~ yj 列,两个维度都是左闭右开。
  • <3> 切片特殊情况:左边从0开始可以省略,右边到结尾可以省略,即 X[:e0,s1:e1] ,表示第1维从第1行开始到第 e0 行;X[s0:,s1:e1],表示从第 s0 行到最后一行。

常用的切片操作如下所示(以二维数组为例,n1 数组就是4.1索引中创建的),具体运行结果,这里不再展示。

print(n1[1:]) # 行切片,取第二行到最后一行
print(n1[:,2:]) # 列切片,取第三列到最后一列
print(n1[:]) # 复制数组
print(n1[[0,2]]) # 取不连续的行,用两个括号
print(n1[:,[0,2]])# 取不连续的列
print(n1[::-1]) # 行翻转
print(n1[:,::-1]) # 列翻转
print(n1[::-1,::-1]) # 行列都翻转

如果对某些切片操作有疑问,欢迎大家联系我,文末附联系方式,我看到后一定会第一时间为大家解答的。

五、实例 - 图片翻转

我们依旧采用 1.3 中的 tangsan.jpg 图片,通过对 ndarray 数据切片实现图片翻转效果,这里只展示上下翻转的效果,大家也可以换图片尝试。

# 读取图片
nd = plt.imread('pic/tangsan.jpg')
# 显示原图
plt.imshow(nd)
# 上下翻转,通过改变 nd 数组,将纵轴翻转,也就是横轴逆序实现
plt.imshow(nd[::-1])

plt.imshow(nd[:,::-1]) # 左右翻转

六、变形

通过 reshape 函数,我们可以改变数组的形状,或者说维度,注意改变后需要重新赋值给数组。

首先创建好如下的数组:

n1 = np.array([
    [3,5],
    [4,2],
    [2,3]
])
n1

然后改变形状:

n1.reshape((6,1))

让行或列自适应,通过维数写 - 1 实现:

n1.reshape((2,-1)) # 行数为2,列数自适应
n1.reshape(-1,2) # 列数为2,行数自适应

七、合并与拆分

7.1 合并

concatenate 函数用法:concatenate((a1, a2, …), axis=0, out=None),a1,a2 表示数组,axis 表示轴,值为0表示横向合并,值为1表示纵向合并。

n1 = n1.reshape((2,3))
n2 = np.random.randint(0,10,(2,3))
display(n1,n2)
n3 = np.concatenate((n1,n2),axis=0) # 行合并
n4 = np.concatenate((n1,n2),axis=1) # 列合并
display(n3,n4)

此外,还可以使用 hstack 函数和 vstack 函数单独实现水平合并和垂直合并。相比,concatenate 函数会更方便些。

n2 = np.random.randint(0,10,(2,3))
n1 = np.random.randint(0,10,(2,3))
display(n1,n2)
n3 = np.hstack((n1,n2)) # 水平合并
n4 = np.vstack((n1,n2)) # 垂直合并
display(n3,n4)

7.2 拆分

split 函数用法:np.split(ary, indices_or_sections, axis=0),ary:要切分的数组,indices_or_sections:填入一个整数或者一个可迭代对象,如果是整数,就切分为整数个子数组;如果是可迭代对象,就在该索引位置切分。

将数组进行拆分为多个数组,通过 axis (轴),可以控制水平或垂直拆分,具体请看下面的示例。

n3 = n3.reshape((6,2))
display(n3) # 1.查看 n3 数组
n5 = np.split(n3,2,axis=0) # 横向切分,均分为2部分
n6 = np.split(n3,1,axis=1) # 纵向切分,均分为1部分
print(n5)
print(n6)
n7 = np.split(n3,[1,3],axis=0) # 在索引为 0 和 3 处切分,切分为3部分
print(n7)

运行结果:

和合并一样,也有单独进行水平拆分和垂直拆分的方法,分别是:hsplit 和 vsplit ,函数用法参数都是 np.hsplit(ary, indices_or_sections) ,具体用法这里不再展示。

八、数组拷贝

使用 copy 函数创建一个数组的副本。

n4 = np.copy(n3) # 数组拷贝

结语

本期跟大家分享的 “芝士” 就到此结束了,关于 NumPy 的基本操作,你学会了吗?

💕 好啦,这就是今天要分享给大家的全部内容了,我们下期再见! ✨
🍻 如果你喜欢的话,就不要吝惜你的一键三连了~ 🍻

如果文中有些地方不清楚的话,欢迎联系我,我会给大家提供思路及解答。

相关导读

文章直达链接
上期回顾【数据分析 - 基础入门之NumPy③】- 日常难疑解决
下期预告【数据分析 - 基础入门之NumPy⑤】- NumPy基本操作 - 二

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/728498.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

渗透专题丨Vulnhub-Tr0ll靶机打靶

首先安装好靶机&#xff0c;再打开Kali&#xff0c;使用ifconfig查看Kali IP信息&#xff0c;之后使用nmap进行扫描网段&#xff1a; image-20230629200225568 经过排除主机IP和Kali IP&#xff0c;选择192.168.38.139&#xff0c;进行端口扫描&#xff1a; image-20230629201…

PDF怎么转Excel?这三个方法非常实用!

在现代生活中&#xff0c;PDF&#xff08;Portable Document Format&#xff09;已成为广泛使用的文件格式之一。然而&#xff0c;有时我们需要将PDF文件中的数据提取并转换为Excel&#xff08;电子表格&#xff09;格式&#xff0c;以便更方便地编辑、分析和处理数据。本文将介…

剑指offer34.二叉树中和为某一值的路径

用深度遍历的方法找出每一条路径&#xff0c;看看和是否是目标值。 class Solution {Deque<Integer> queue new LinkedList<Integer>();List<List<Integer>> res new LinkedList<List<Integer>>();public List<List<Integer>&…

Component name ‘Channel‘ should always be multi-word

新建vue文件后&#xff0c;会出现第一行代码爆红现象 报错原因: 在组件命名的时候未按照 ESLint 的官方代码规范进行命名&#xff0c;根据 ESLint 官方代码风格指南&#xff0c;除了根组件&#xff08;App.vue&#xff09;以外&#xff0c;其他自定义组件命名要使用大驼峰命名方…

IO流总结:

常用方法&#xff1a; 输入&#xff1a; new bufferedreader(new FileReader(“a.txt”))

Hadoop知识点

1.HDFS写数据流程 客户端通过Distributed FileSystem模块向NameNode请求上传文件&#xff0c;NameNode检查目标文件是否已存在&#xff0c;父目录是否存在。NameNode返回是否可以上传。客户端请求第一个 Block上传到哪几个DataNode服务器上。NameNode返回3个DataNode节点&#…

进程池线程池实现TCP高性能并发通信

进程池线程池实现TCP高性能并发通信 使用进程池与线程池实现并发服务&#xff0c;为多个客户进行接收和发送消息的服务 代码实现 # 导入进程池 from multiprocessing import Pool, cpu_count # 导入线程池 from multiprocessing.pool import ThreadPool from socket import …

动态规划P1

动态规划P1 1.数字三角形模型 1.1只取一条最大路或最小路 1015. 摘花生 只能向下或向右走&#xff0c;求最大能取多少花生 记录每个点最大能取到多少花生&#xff0c;从左上一直推到右下角 d p [ i ] [ j ] m a x ( d p [ i − 1 ] [ j ] , d p [ i ] [ j − 1 ] ) a [ …

mybatis-plus记录

1. 导入依赖 注意&#xff1a;springboot和mybatisplus的版本必须一致 导入build工具 <build><plugins><!-- 具体插件&#xff0c;逆向工程的操作是以构建过程中插件形式出现的 --><plugin><groupId>org.mybatis.generator</groupId>&l…

微信视频号配合OBS拉流推流开直播

背景 公司有要求&#xff0c;要实现外部视频流的同步直播&#xff0c;所以特意研究了一下OBS软件结合微信视频号直播的操作步骤。 一、OBS软件配置 &#xff08;一&#xff09;配置拉流 启动OBS软件-点击“”-选择增加“媒体源” 创建源名称 取消本地文件-填写拉流地址-…

MFC List Control控件添加单元格编辑和单元格下拉列表

文章目录 初始化编译栏的创建与销毁下拉列表的创建与销毁自定义编译栏与下拉框的焦点问题点击CListCtrl 事件处理程序双击添加全部代码 ui 设置 初始化 #define IDC_EDIT_CREATEID 3000 #define IDC_COMBOX_CREATEID 3001int e_Item0; //刚编辑的行 int e_SubItem2; //刚…

导入数据解析

Before未定义异常情况 继承 AnalysisEventListener 重写 onException Overridepublic void onException(Exception exception, AnalysisContext context) throws Exception {if (exception instanceof ExcelDataConvertException) {ExcelDataConvertException excelDataConvert…

Django的数据库模型迁移命令makemigrations和migrate是否会导致数据库中的数据丢失?

我们知道&#xff0c;如果在Django的文件models.py中写好了数据库模型&#xff0c;要生成对应的数据库&#xff0c;需要执行下面两条命令&#xff1a; python manage.py makemigrations python manage.py migrate其中命令 makemigrations 是生成迁移执行文件&#xff0c;命令 …

tortoiseGit fatal: Could not read from remote repository.

1、问题场景&#xff1a; 使用tortoiseGit工具pull代码的时候报错 git.exe pull --progress -v --no-rebase "origin" fatal: Could not read from remote repository. Please make sure you have the correct access rights and the repository exists. 无法从存…

投票管理平台达到投票平台投票平台平台投票

现在来说&#xff0c;公司、企业、学校更多的想借助短视频推广自己。 通过微信投票小程序&#xff0c;网友们就可以通过手机拍视频上传视频参加活动&#xff0c;而短视频微信投票评选活动既可以给用户发挥的空间激发参与的热情&#xff0c;又可以让商家和企业实现推广的目的&am…

基于图的路径规划算法对比

基于图的路径规划算法对比 算法说明与实现效果构造路网路网数据转化为图matlab代码 算法说明与实现效果 通过构造邻接矩阵&#xff0c;在构造的路网中找到一个节点通向另一个节点的最短路径&#xff0c;包括DJ&#xff0c;Floyd&#xff0c;A*&#xff0c;ACO&#xff0c;GA算…

以阻塞方式对IO文件进行读取

以阻塞方式对IO文件进行读取(test.c读取&#xff0c;test2.c发送数据) 实验结果 执行test.c生成的pro1可执行文件&#xff0c;光标显示处于阻塞状态 执行test2.c生成的pro2可执行文件&#xff0c;test.c处打印 hello dhl 三级标题test.c #include <stdlib.h> #inclu…

【Leetcode】209. 长度最小的子数组

给定一个含有 n 个正整数的数组和一个正整数 s &#xff0c;找出该数组中满足其和 ≥ s 的长度最小的 连续 子数组&#xff0c;并返回其长度。如果不存在符合条件的子数组&#xff0c;返回 0。 示例&#xff1a; 输入&#xff1a;s 7, nums [2,3,1,2,4,3] 输出&#xff1a;…

干货满满!阿里、京东、网易等多位专家力荐的高并发编程速成笔记

前一段时间在某乎看到一个提问&#xff0c;说的是他才一年半经验&#xff0c;去面试却被各种问到分布式、高并发、多线程之间的问题。基础层面上的是可以答上来&#xff0c;但是面试官深问的话就不会了&#xff01;被问得都怀疑现在Java招聘初级岗位到底招的是初级开发还是架构…

7-7作业

发送端 #include<stdio.h> #include<Windows.h> #include<windows.h> #include<WinSock2.h> #include<string.h> #include<stdlib.h> #define ERR_OR(msg) do{\ fprintf(stderr, "__%d__", __LINE__);\ perror(msg);\ }while(0…