Numpy基础与实例——人工智能基础

news2024/12/29 10:58:47

文章目录

  • 一、Numpy概述
      • 1、优势
      • 2、numpy历史
      • 3、Numpy的核心:多维数组
      • 4、内存中的ndarray对象
        • 4.1 元数据(metadata)
        • 4.2 实际数据
  • 二、numpy基础
    • 1、 ndarray数组
    • 2、 arange、zeros、ones、zeros_like
    • 3、ndarray对象属性的基本操作
      • 3.1 修改数组维度
      • 3.2 修改数组元素类型
      • 3.3 数组的size
    • 4、 数组元素索引
    • 5、 Numpy内部基本数据类型
      • 5.1 基本数据类型简写的应用案例
      • 5.2 将列表强转为
        • 方式1 通过字符串的方式指定dtype(不常用)
        • 方式2:通过列表套元组(不常用)
        • 方式3:通过字典的固定键设置dtype
      • 5.3 datetime64
    • 6、ndarray数组维度操作
      • 6.1 视图变维(数据共享):reshape()与ravel()
      • 6.2 赋值变维(数据独立)
      • 6.3 就地变维:直接改变原数组的维度,不返回新数组
    • 7、 ndarray数组切片操作
      • 7.1 一维数组切片
      • 7.2 多维数组切片
      • 7.3 ndarray数组的掩码操作
        • 布尔掩码
        • 布尔掩码操作案例:求100以内3的倍数的数字
          • 标签掩码:掩码数组中为索引值

一、Numpy概述

1、优势

  1. Numpy(Nummerical Python),补充了Python语言所欠缺的数值计算能力;
  2. Numpy是其它数据分析及机器学习库的底层库;
  3. Numpy完全标准的C语言实现,运行效率充分优化(Python 1989年出现,1991年发布);
  4. Numpy开源免费。

2、numpy历史

  1. 1995年,Numeric,Python语言数值计算扩充;
  2. 2001年,Scipy->Numarray,多维数组运算;
  3. 2005年,Numeric+Numarray->Numpy。
  4. 2006年,Numpy脱离Scipy成为独立的项目。

3、Numpy的核心:多维数组

  1. 代码简洁:减少Python代码中的循环
  2. 底层实现: 厚内核©+薄接口(Python),保证性能.

4、内存中的ndarray对象

4.1 元数据(metadata)

存储对目标数组的描述信息,如: ndim、shape、dtype、data等.
在这里插入图片描述

4.2 实际数据

完整的数组数据
将实际数据与元数据分开存放,一方面提高了内存空间的使用效率另一方面减少对实际数据的访问频率,提高性能。
ndarray数组对象的特点

  1. Numpy数组是同质数组,即所有元素的数据类型必须相同
  2. Numpy数组的下标从0开始,最后一个元素的下标为数组长度减1
    ndarray数组对象的特点
  3. Numpy数组是同质数组,即所有元素的数据类型必须相同
  4. Numpy数组的下标从0开始,最后一个元素的下标为数组长度-1

二、numpy基础

1、 ndarray数组

import numpy as np

# 通过array创建ndarray
ary = np.array([1, 2, 3 , 4, 5])
print(ary)
print(type(ary))

# 数组与元素的运算是数组与每个元素分别运算
print(ary+2)
print(ary*2)
print(ary == 3)

# 数组与数组之间的运算 是 对应位置对应计算,数组不等不能计算
print(ary + ary)
print(ary * ary)

# 输出:
# [1 2 3 4 5]
# <class 'numpy.ndarray'>
# [3 4 5 6 7]
# [ 2  4  6  8 10]
# [False False  True False False]
#[ 2  4  6  8 10]
#[ 1  4  9 16 25]

数组元素的运算数组与每个元素分别运算;
数组数组之间的运算对应位置对应计算
数组长度不等不能计算

2、 arange、zeros、ones、zeros_like

import numpy as np

ary = np.array([1, 2, 3 , 4, 5])
print(ary)

print(ary + ary)
print(ary * ary)
aryrange = np.arange(1,3)
print(aryrange)
aryrange = np.arange(1,3,0.1)
print(aryrange)

ary = np.zeros(10) # 生成0数组
print(ary)
ary = np.zeros(10, dtype='int64')  # 设置数据类型
print(ary)

ary = np.zeros((2 ,2)) # 生成2*2的矩阵
print(ary)
print(ary.shape)

ary = np.array([1, 2, 3 , 4, 5])  # 拿到一个数组,用0填充
print(np.zeros_like(ary))

# 输出
# [1 2 3 4 5]
# [ 2  4  6  8 10]
# [ 1  4  9 16 25]
# [1 2]
# [1.  1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.  2.1 2.2 2.3 2.4 2.5 2.6 2.7
#  2.8 2.9]

# [0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
# [0 0 0 0 0 0 0 0 0 0]

# [[0. 0.]
# [0. 0.]]

# (2, 2)

# [1 2 3 4 5]
# [0 0 0 0 0]

python的range只能生成整数,而arange可生成浮点数
zeros_like拿到一个数组,用0填充
ones_like用法类似

3、ndarray对象属性的基本操作

3.1 修改数组维度

import numpy as np

ary = np.arange(1, 9)
print(ary)

# 直接修改原始数据的维度
ary.shape = (2, 4)  
print(ary)
print(ary.shape)

# 修改为3维数据
ary.shape = (2, 2, 2)
print(ary)
print(ary.shape)

# [1 2 3 4 5 6 7 8]

# [[1 2 3 4]
# [5 6 7 8]]
# (2, 4)

# [1 2 3 4 5 6 7 8]
# [[[1 2]
#   [3 4]]
# 
#  [[5 6]
#   [7 8]]]
# (2, 2, 2)

直接使用shape修改数组形状

3.2 修改数组元素类型

ary = np.arange(1, 9)
ary.dtype = "float64"  # 只能修改解析方式,修改数据类型只能用astype
print(ary)

ary = np.arange(1, 9)
c = ary.astype(float)  # 不会修改原始数据,可用一个变量去接收
print(c)

# 输出
# [4.24399158e-314 8.48798317e-314 1.27319747e-313 1.69759663e-313]
# [1. 2. 3. 4. 5. 6. 7. 8.]

修改数组类型不可使用dtype,此方式只能修改解析方式,会得到一个错误的值
可使用astype()去修改,此方式不会修改原始数据可用一个新变量去接收

3.3 数组的size

import numpy as np

ary = np.arange(1, 9)
print(ary)

print(ary.shape)
print(ary.size)
print(len(ary))
ary.shape = (2, 4)
print(ary.shape)
print(ary.size)
print(len(ary))

# 输出
# [1 2 3 4 5 6 7 8]
# (8,)
# 8
# 8
# (2, 4)
# 8
# 2

size是指数组元素个数,一维数组的len和size是一样的,二多维数组则不一样,在二维数组时,size是指二维数组中第二维度的个数。

4、 数组元素索引

import numpy as np

ary = np.arange(1, 9)
ary.shape = (2, 2, 2)
print(ary)

print(ary[0])  # 访问三维数组的第一个二维数组
print(ary[0][0])   # 访问二维数组的第一一维数组
print(ary[0][0][0]) # 访问一维数组的第一个元素

print(ary[0,0,0]) # numpy的全新写法

# 输出

# [[[1 2]
#   [3 4]]
#
#  [[5 6]
#   [7 8]]]

# [[1 2]
#  [3 4]]

# [1 2]

# 1

# 1

5、 Numpy内部基本数据类型

在这里插入图片描述
类型字符码

5.1 基本数据类型简写的应用案例

import numpy as np

data = [('zs', [100, 90, 95], 18),
        ('ls', [100, 95, 93], 22),
        ('ww', [98, 98, 98], 20)]

print(data)

ary = np.array(data)
print(ary)

ary = np.array(data, dtype='U2, 3int8, int8')
print(ary)

5.2 将列表强转为

方式1 通过字符串的方式指定dtype(不常用)

import numpy as np

data = [('zs', [100, 90, 95], 18),
        ('ls', [100, 95, 93], 22),
        ('ww', [98, 98, 98], 20)]

ary = np.array(data, dtype='U2, 3int8, int8')

sum = 0
for i in data:
    sum = i[2]+sum
print(sum/3)

print(ary['f2'].mean())

以上代码使用2种方式求年龄的平均值

方式2:通过列表套元组(不常用)

import numpy as np
import warnings
warnings.filterwarnings('ignore')

data = [('zs', [100, 90, 95], 18),
        ('ls', [100, 95, 93], 22),
        ('ww', [98, 98, 98], 20)]

# print(data)

ary = np.array(data)
# print(ary)

ary = np.array(data, dtype=[('name', 'str', 2),
                            ('score', 'int32', 3),
                            ('age', 'int32', 1)])
print(ary['score'].mean())
# 输出
# 20

方式3:通过字典的固定键设置dtype

import numpy as np
import warnings
warnings.filterwarnings('ignore')

data = [('zs', [100, 90, 95], 18),
        ('ls', [100, 95, 93], 22),
        ('ww', [98, 98, 98], 20)]

# print(data)

ary = np.array(data)
# print(ary)

ary = np.array(data, dtype={'names': ['name', 'score', 'age'], 'formats': ['U2', '3int32', 'int32']})

print(ary['age'])
# 输出
# [18 22 20]

5.3 datetime64

import numpy as np
import warnings
warnings.filterwarnings('ignore')

data = np.array(['2011', '2012-12-12', '2023-02-13 08:08:08'])

# 将字符串转成时间日期(精确到日)类型
pretty_data = data.astype("datetime64[D]")
print(pretty_data)

# 转成整形
res = pretty_data.astype('int64')  
print(res)  # 返回距1970年1月1日的天数

# 将字符串转成时间日期(精确到秒)类型
pretty_data = data.astype("datetime64[s]")
print(pretty_data)

# 转成整形
res = pretty_data.astype('int64')
print(res)  # 返回距1970年1月1日的秒数

# 输出

# ['2011-01-01' '2012-12-12' '2023-02-13']

# [14975 15686 19401]

# ['2011-01-01T00:00:00' '2012-12-12T00:00:00' '2023-02-13T08:08:08']

# [1293840000 1355270400 1676275688]

numpy的日期格式要求严格
字符串的格式不能形如 2021-1-1也不能形如2021/01/01

6、ndarray数组维度操作

容器:酒瓶 元素:酒
赋值拷贝:酒瓶装旧酒
浅拷贝:新瓶装旧酒
深拷贝:新瓶装新酒

6.1 视图变维(数据共享):reshape()与ravel()

import numpy as np
import warnings
warnings.filterwarnings('ignore')

ary = np.arange(1, 9)
print(ary)
# 视图变维
bry = ary.reshape(2, 4)
print(bry)
print(ary)
ary[0] = 123
print("修改后的ary:", ary)
print("bry:", bry)
# 输出
# [1 2 3 4 5 6 7 8]
# [[1 2 3 4]
# [5 6 7 8]]
# [1 2 3 4 5 6 7 8]
# 修改后的ary: [123   2   3   4   5   6   7   8]
# bry: [[123   2   3   4]
# [  5   6   7   8]]

只是形状发生了改变,修改了原始数据,变维后的数据跟着变,这就是所谓的数据共享
变维后的数据虽然在形状上发生了变化,但不影响变维前的数据
ravel将数组(不管几维)拉伸为1维

6.2 赋值变维(数据独立)

import numpy as np
import warnings
warnings.filterwarnings('ignore')

ary = np.arange(1, 9).reshape(2, 4)
print(ary)

bry = ary.flatten()
print(bry)

ary[0] = 666
print(ary)

print(bry)

# 输出
# [[1 2 3 4]

#  [5 6 7 8]]

# [1 2 3 4 5 6 7 8]

# [[666 666 666 666]
#  [  5   6   7   8]]

# [1 2 3 4 5 6 7 8]

6.3 就地变维:直接改变原数组的维度,不返回新数组

import numpy as np
import warnings
warnings.filterwarnings('ignore')

ary = np.arange(1, 9)
ary.resize(2, 2, 2)
print(ary)

ary = np.arange(1, 9)
ary.resize(2, 2, 2)
print(ary)

7、 ndarray数组切片操作

7.1 一维数组切片

数组对象切片的参数设置与列表切片参数类似
步长+:默认切从首到尾
步长-:默认切从尾到头
数组对象[起始位置终止位置步长,…]
默认步长:1

在这里插入图片描述

7.2 多维数组切片

import numpy as np
import warnings
warnings.filterwarnings('ignore')

ary = np.arange(1, 9)
ary.resize(3,3)
print(ary)
print(ary[:2])  # 前两行
print(ary[:2, :2])  # 前两行的前两列
print(ary[::2, ::2])  # 1 3行,1 3列

# 输出
# [[1 2 3]
#  [4 5 6]
#  [7 8 0]]
# [[1 2 3]
#  [4 5 6]]
# [[1 2]
#  [4 5]]
# [[1 3]
#  [7 0]]

import numpy as np
import warnings
warnings.filterwarnings('ignore')

ary =np.arange(1, 101).reshape(20, 5)
print(ary)
# 所有行不要最后一列
print("所有行不要最后一列")
print(ary[:, :-1])
# 所有行只要最后一列
print(ary[:, -1])

7.3 ndarray数组的掩码操作

布尔掩码

import numpy as np
import warnings
warnings.filterwarnings('ignore')

ary = np.arange(1, 10)
mask = [True, False, True, True, False, True, True, True, False]
res = ary[mask]
print(res)

# 输出
# [1 3 4 6 7 8]

布尔掩码操作案例:求100以内3的倍数的数字

import numpy as np
import warnings
warnings.filterwarnings('ignore')

ary = np.arange(1, 101)
print(ary[ary % 3 == 0])

标签掩码:掩码数组中为索引值
import numpy as np
import warnings
warnings.filterwarnings('ignore')

car = np.array(['bwm', 'benzi', 'audi', 'hongqi'])
mask = [0, 2, 1, 3]
res = car[mask]
print(res)

# 输出
# ['bwm' 'audi' 'benzi' 'hongqi']

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/343894.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

羊了个羊游戏开发教程1:堆叠牌的拾取

本文首发于微信公众号&#xff1a; 小蚂蚁教你做游戏。欢迎关注领取更多学习做游戏的原创教程资料&#xff0c;每天学点儿游戏开发知识。嗨&#xff01;大家好&#xff0c;我是小蚂蚁。最近“羊了个羊”小游戏爆火。一下子让想做微信小游戏或者想学做微信小游戏的人多了很多&am…

Java Map集合

8 Map集合 HashMap: 元素按照键是无序&#xff0c;不重复&#xff0c;无索引&#xff0c;值不做要求 LinkedHashMap: 元素按照键是有序&#xff0c;不重复&#xff0c;无索引&#xff0c;值不做要求 8.1 Map集合概述和特点 Map集合是一种双列集合&#xff0c;每个元素包含两个…

【C++】 C C++ 内存管理

文章目录&#x1f4d5; C、C 内存分布&#x1f4d5; C 内存管理方式1. 操作内置类型2. 操作自定义类型&#x1f4d5; operator new 与 operator delete&#x1f4d5; 定位 new&#x1f4d5; C、C 内存分布 C 和 C 的内存分布没什么区别&#xff0c;C 是基于 C 语言的&#xff…

腾讯xSRC[linux+docker]搭建教程

腾讯xSRC[linuxdocker]搭建教程 1.下载镜像 docker pull xsrc/xsrc:v1.0.12.启动镜像 1️⃣启动镜像 docker run -it -d --name xsrc_web -p 60080:80 -p 63306:3306 --privilegedtrue xsrc/xsrc:v1.0.1注意将3306端口映射到8806端口&#xff0c;以便于远程连接访问容器内数…

手写识别字体的步骤是什么?怎么识别图片中的文字?

手写识别字体的步骤是什么&#xff1f;怎么识别图片中的文字&#xff1f; 1. 打开信风工具网&#xff0c;点击拍照按钮&#xff0c;选择拍图识字模式&#xff0c;对准需要识别的文件进行拍摄&#xff61;在线工具地址&#xff1a; https://ocr.bytedance.zj.cn/image/ImageT…

VScode 自定义主题颜色

vscode其实已经有很多完善且好看的主题了&#xff0c;但我总觉得每一个主题对我来说&#xff0c;都有那么一点点不够完美&#xff0c;比如亮色的主题&#xff0c;颜色就没有深色主题那么好看&#xff0c;对比度高。 好不容易看到一个好看的主题吧&#xff0c;又觉得某一部分的…

2023213-popover弹窗框中的teleported属性--Element-plus踩坑日记

popover弹窗框中的teleported属性–Element plus踩坑日记 今天在做项目时&#xff0c;有一个地方用到了弹窗框&#xff0c;但是有需求需要修改弹窗的阴影部分 比如下方的 我想对阴影进行修改&#xff0c;但是很是纳闷&#xff0c;各种标签选择器都不生效&#xff0c;很奇怪。…

使用地理定位来自定义网络钓鱼

在全球市场中&#xff0c;地理定位的能力是巨大的。 从本质上讲&#xff0c;这意味着企业可以根据收件人的位置定制广告。 纽约人可能会收到与法国人不同的广告。这使得广告对企业更有价值&#xff0c;对消费者来说更个性化。 还有另一群人想要个性化他们的产品&#xff1a;…

2023年要跟踪的11个销售管理关键指标

销售管理关键指标有&#xff1a;营销合格线索数量&#xff08;MQL&#xff09;、MQL 到 SQL 的转换率、商机赢单率、获客成本、总销售额、客户终身价值&#xff08;LTV&#xff09;、LTV 与 CAC 比率、赢单周期、每客户平均销售额&#xff08;平均客单价&#xff09;、每销售人…

全球十大资质正规现货黄金交易平台排名榜单(最新版汇总)

如今&#xff0c;在金融市场上&#xff0c;黄金已经成为公众喜爱的避险产品&#xff0c;尤其是近年来出现的现货黄金&#xff0c;这是许多朋友日常财务管理的标准。但我们在参考黄金交易平台排名进场时&#xff0c;需要留意哪些因素&#xff1f; 1、交易模式 事实上&#xf…

软件测试 -- 高阶 2 软件测试与软件开发

辅车相依&#xff0c;唇亡齿寒。-- 《左传僖公五年》 释译&#xff1a;颊骨和齿床互相依靠&#xff0c;嘴唇没有了&#xff0c;牙齿就会感到寒冷。比喻利害密要相关&#xff0c;命运紧密相关联。-- 百度百科 测试与开发是什么关系&#xff1f; 1. 软件开发流程 2. 开发和测…

AcWing 167. 木棒(DFS + 剪枝优化)

AcWing 167. 木棒&#xff08;DFS 剪枝优化&#xff09;一、问题二、分析1、整体分析2、剪枝优化&#xff08;1&#xff09;优化搜索顺序&#xff08;2&#xff09;排除等效冗余&#xff08;3&#xff09;可行性剪枝&#xff08;4&#xff09;最优性剪枝&#xff08;5&#xf…

ASEMI低压MOS管AO3401封装,AO3401图片

编辑-Z ASEMI低压MOS管AO3401参数&#xff1a; 型号&#xff1a;AO3401 封装&#xff1a;SOT-23 漏极-源极电压&#xff08;VDS&#xff09;&#xff1a;30V 栅源电压&#xff08;VGS&#xff09;&#xff1a;12V 连续漏电流&#xff08;I&#xff09;&#xff1a;4.2A …

K_A12_004 基于STM32等单片机采集人体红外感应(HC-SR501)模块串口与OLED0.96双显示

K_A12_004 基于STM32等单片机采集人体红外感应&#xff08;HC-SR501&#xff09;模块串口与OLED0.96双显示一、资源说明二、基本参数参数引脚说明三、驱动说明模块工作原理:对应程序:四、部分代码说明1、接线引脚定义1.1、STC89C52RCHC-SR501模块1.2、STM32F103C8T6HC-SR501模块…

docker-compose概述与简单编排部署

一、Docker-compose 简介Docker-Compose项目是基于Python开发的Docker官方开源项目&#xff0c;负责实现对Docker容器集群的快速编排。Docker-Compose将所管理的容器分为三层&#xff0c;分别是 工程&#xff08;project&#xff09;&#xff0c;服务&#xff08;service&#…

MySQL学习笔记——CSDN学习记录九:数据库存储引擎

存储引擎 一、MySQL 体系结构&#xff1a; 二、存储引擎概念&#xff1a; MySQL 中的数据用于各种不同的技术存储在文件或内存。这些技术的每一个都使用不同的存储机制、索引技巧、锁定水平&#xff0c;最终提供不同的功能。通过选择不同的技术&#xff0c;能够得到更好的数据处…

03- SVC 支持向量机做人脸识别 (项目三)

数据集描述: sklearn的lfw_people函数在线下载55个外国人图片文件夹数据集来精确实现人脸识别并提取人脸特征向量数据集地址: sklearn.datasets.fetch_lfw_people — scikit-learn 1.2.1 documentationPCA降维: pca PCA(n_components0.9) 数据拆分: X_train, X_test, y_tra…

正大期货本周财经大事抢先看

美国1月CPI、Fed 等央行官员谈话 美国1月超强劲的非农就业人口&#xff0c;让投资人开始上修对这波升息循环利率顶点的预测&#xff0c;也使本周二 (14 日) 的美国 1月 CPI 格外受关注。 介绍正大国际期货主账户对比国内期货的优势 ​第一点&#xff1a;权限都在主账户 例如…

B站基于缓存优化 PRESTO 集群查询性能

导读&#xff1a;本次分享主题为 B 站 Presto 集群查询性能的优化&#xff0c;首先会简单介绍 Presto以及 B 站内部 Presto 集群的架构。接下来讲解针对 Presto 做的改造&#xff0c;主要是 Presto 搭配 Alluxio 和 Presto 搭配 Alluxio local cache 的使用。最后会对后续计划开…

C++类基础(十三)

类的继承 ● 通过类的继承&#xff08;派生&#xff09;来引入“是一个”的关系&#xff08; 17.2 — Basic inheritance in C&#xff09; – 通常采用 public 继承&#xff08; struct V.S. class &#xff09; – 注意&#xff1a;继承部分不是类的声明 – 使用基类的指针…