numpy学习笔记10:arr *= 2向量化操作性能优化

news2025/3/29 8:46:22

numpy学习笔记10:arr *= 2向量化操作性能优化

在 NumPy 中,直接对整个数组进行向量化操作(如 arr *= 2)的效率远高于显式循环(如 for i in range(len(arr)): arr[i] *= 2)。以下是详细的解释:


1. 性能差异的原理

(1) 底层实现不同
  • 显式循环(错误示范)

    • Python 的 for 循环是解释执行的,每次迭代需要动态解析变量类型、执行函数调用等操作。

    • 对每个元素的操作会触发多次 Python 层面的类型检查和计算,产生额外开销。

  • 向量化操作(正确示范)

    • NumPy 的 arr *= 2 是编译后的低级代码(C/Fortran 实现),直接操作连续的内存块

    • 所有元素的乘法操作一次性完成,无需逐元素处理,且支持 SIMD 指令并行加速。

(2) 内存访问效率
  • 显式循环

    • 逐个元素操作会导致频繁的内存访问,缓存命中率低。

  • 向量化操作

    • 连续的内存块一次性加载到 CPU 缓存,充分利用缓存局部性。

(3) 并行化能力
  • 显式循环

    • Python 的全局解释器锁(GIL)限制多线程并行。

  • 向量化操作

    • 底层库(如 Intel MKL、OpenBLAS)可能使用多线程或 SIMD 指令并行处理多个元素


2. 性能对比实验

使用 timeit 模块测试两种方法的执行时间(以 100 万个元素的数组为例):

import numpy as np
import timeit

arr = np.random.rand(1_000_000)
print("数组的形状:", arr.shape)
print("数组的前 10 个元素:", arr[:10])

# 错误示范:显式循环
def slow_method():
    global arr
    for i in range(len(arr)):
        arr[i] *= 2

# 正确示范:向量化操作
def fast_method():
    global arr
    arr *= 2

# 测量执行时间
t_slow = timeit.timeit(slow_method, number=100)
t_fast = timeit.timeit(fast_method, number=100)

print(f"显式循环耗时: {t_slow:.4f} 秒")
print(f"向量化操作耗时: {t_fast:.4f} 秒")

输出结果示例

显式循环耗时: 5.3127 秒
向量化操作耗时: 0.0052 秒
  • 向量化操作比显式循环快约 1000 倍


3. 关键优势

(1) 避免 Python 循环开销
  • Python 的 for 循环每次迭代需要:

    • 检查循环变量类型。

    • 调用 __getitem__ 和 __setitem__ 方法。

    • 管理循环计数器。

  • 这些操作在大量迭代时会累积成显著的时间损耗。

(2) 编译优化
  • NumPy 的向量化操作通过预编译的低级代码直接操作内存,避免 Python 解释器的动态类型检查。

  • 例如,arr *= 2 在底层等效于以下 C 代码:

    for (int i = 0; i < n; i++) {
        arr[i] *= 2;
    }

    但编译后的代码无需每次循环解析类型。

(3) 内存连续性
  • NumPy 数组在内存中是连续存储的,向量化操作可以一次性加载大块数据到 CPU 缓存,减少内存访问延迟。


4. 其他向量化操作示例

所有 NumPy 的数学运算均支持向量化,无需显式循环:

# 加法
arr += 5

# 乘法
arr *= 3

# 数学函数
arr = np.sin(arr)

# 布尔运算
mask = arr > 0.5

5. 何时使用显式循环?

  • 无法向量化的复杂逻辑

    # 例如,元素间依赖关系(前一个元素影响后一个)
    for i in range(1, len(arr)):
        arr[i] = arr[i-1] * 2
  • 需要逐个处理的特殊情况

    for i in range(len(arr)):
        if arr[i] < 0:
            arr[i] = 0

总结

  • 优先使用向量化操作:对数组的整体运算(如 arr *= 2)应直接使用 NumPy 的内置函数或运算符。

  • 避免显式循环:Python 的 for 循环在处理大型数组时效率极低。

  • 性能敏感场景:向量化操作是科学计算的黄金标准,可充分利用硬件加速。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2320367.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

蓝桥杯备考:二分答案之路标设置

最大距离&#xff0c;找最小空旷指数值&#xff0c;我们是很容易想到用二分的&#xff0c;我们再看看这个答案有没有二段性 是有这么个二段性的&#xff0c;我们只要二分就行了&#xff0c;但是二分的check函数是有点不好想的&#xff0c;我们枚举空旷值的时候&#xff0c;为了…

回调方法传参汇总

文章目录 0. 引入问题1. 父子组件传值1.1 父传子&#xff1a;props1.2 子传父&#xff1a;$emit1.3 双向绑定&#xff1a;v-model 2. 多个参数传递3. 父组件监听方法传递其他值3.1 $event3.2 箭头方法 4. 子组件传递多个参数&#xff0c;父组件传递本地参数4.1 箭头函数 … 扩…

XSS基础靶场练习

目录 1. 准备靶场 2. PASS 1. Level 1&#xff1a;无过滤 源码&#xff1a; 2. level2&#xff1a;转HTML实体 htmlspecialchars简介&#xff1a; 源码 PASS 3. level3:转HTML深入 源码&#xff1a; PASS 4. level4:过滤<> 源码&#xff1a; PASS: 5. level5:过滤on 源码…

Redis核心机制(一)

目录 Redis的特性 1.速度快 2.以键值对方式进行存储 3.丰富的功能 4.客户端语言多 5.持久化 6.主从复制 7.高可用和分布式 Redis使用场景 Redis核心机制——持久化 RDB bgsave执行流程 ​编辑 AOF AOF重写流程 3.混合持久化&#xff08;RDBAOF&#xff09; Red…

QGroupBox取消勾选时不禁用子控件

默认情况下&#xff0c;QGroupBox取消勾选会自动禁用子控件&#xff0c;如下图所示 那么如何实现取消勾选时不禁用子控件呢&#xff1f; 实现很简单&#xff0c;直接上代码了 connect(ui->groupBox, &QGroupBox::toggled, this, [](bool checked){if (checked false){…

MyBatis-Plus 自动填充:优雅实现创建/更新时间自动更新!

目录 一、什么是 MyBatis-Plus 自动填充&#xff1f; &#x1f914;二、自动填充的原理 ⚙️三、实际例子&#xff1a;创建时间和更新时间字段自动填充 ⏰四、注意事项 ⚠️五、总结 &#x1f389; &#x1f31f;我的其他文章也讲解的比较有趣&#x1f601;&#xff0c;如果喜欢…

canvas数据标注功能简单实现:矩形、圆形

背景说明 基于UI同学的设计&#xff0c;在市面上找不到刚刚好的数据标注工具&#xff0c;遂决定自行开发。目前需求是实现图片的矩形、圆形标注&#xff0c;并获取标注的坐标信息&#xff0c;使用canvas可以比较方便的实现该功能。 主要功能 选中图形&#xff0c;进行拖动 使…

【UI设计】一些好用的免费图标素材网站

阿里巴巴矢量图标库https://www.iconfont.cn/国内最大的矢量图标库之一&#xff0c;拥有 800 万 图标资源。特色功能包括团队协作、多端适配、定制化编辑等&#xff0c;适合企业级项目、电商设计、中文产品开发等场景。IconParkhttps://iconpark.oceanengine.com/home字节跳动…

ubuntu 解挂载时提示 “umount: /home/xx/Applications/yy: target is busy.”

问题如题所示&#xff0c;我挂载一个squanfs文件系统到指定目录&#xff0c;当我使用完后&#xff0c;准备解挂载时&#xff0c;提示umount: /home/xx/Applications/yy: target is busy.&#xff0c;具体的如图所示&#xff0c; 这种提示通常是表明这个路径的内容正在被某些进…

一条不太简单的TEX学习之路

目录 rule raisebox \includegraphics newenviro 、\vspace \stretch \setlength 解释&#xff1a; 总结&#xff1a; 、\linespread newcommand \par 小四 \small simple 、mutiput画网格 解释&#xff1a; 图案解释&#xff1a; xetex pdelatex etc index 报…

Matplotlib完全指南:数据可视化从入门到实战

目录 引言 一、环境配置与基础概念 1.1 安装Matplotlib 1.2 导入惯例 1.3 两种绘图模式 二、基础图形绘制 2.1 折线图&#xff08;Line Plot&#xff09; 2.2 柱状图&#xff08;Bar Chart&#xff09; 三、高级图表类型 3.1 散点图&#xff08;Scatter Plot&#xff…

在大数据开发中ETL是指什么?

hello宝子们...我们是艾斯视觉擅长ui设计和前端数字孪生、大数据、三维建模、三维动画10年经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩! 在数字经济时代&#xff0c;数据已成为企业最核心的资产。然而&#xff0c;分散在业务系统、日志文件…

OAuth 2.0认证

文章目录 1. 引言1.1 系列文章说明1.2 OAuth 2.0 的起源与演变1.3 应用场景概览 2. OAuth 2.0 核心概念2.1 角色划分2.2 核心术语解析 3. 四种授权模式详解3.1 授权码模式&#xff08;Authorization Code Grant&#xff09;3.1.1 完整流程解析3.1.2 PKCE 扩展&#xff08;防止授…

Kubernetes的Replica Set和ReplicaController有什么区别

ReplicaSet 和 ReplicationController 是 Kubernetes 中用于管理应用程序副本的两种资源&#xff0c;它们有类似的功能&#xff0c;但 ReplicaSet 是 ReplicationController 的增强版本。 以下是它们的主要区别&#xff1a; 1. 功能的演进 ReplicationController 是 Kubernete…

[Lc_2 二叉树dfs] 布尔二叉树的值 | 根节点到叶节点数字之和 | 二叉树剪枝

目录 1.计算布尔二叉树的值 题解 2.求根节点到叶节点数字之和 3. 二叉树剪枝 题解 1.计算布尔二叉树的值 链接&#xff1a;2331. 计算布尔二叉树的值 给你一棵 完整二叉树 的根&#xff0c;这棵树有以下特征&#xff1a; 叶子节点 要么值为 0 要么值为 1 &#xff0c;其…

蓝桥杯 之 第27场月赛总结

文章目录 习题1.抓猪拿国一2.蓝桥字符3.蓝桥大使4.拳头对决 习题 比赛地址 1.抓猪拿国一 十分简单的签到题 print(sum(list(range(17))))2.蓝桥字符 常见的字符匹配的问题&#xff0c;是一个二维dp的问题&#xff0c;转化为对应的动态规划求解 力扣的相似题目 可以关注灵神…

可视化动态表单动态表单界的天花板--Formily(阿里开源)

文章目录 1、Formily表单介绍2、安装依赖2.1、安装内核库2.2、 安装 UI 桥接库2.3、Formily 支持多种 UI 组件生态&#xff1a; 3、表单设计器3.1、核心理念3.2、安装3.3、示例源码 4、场景案例-登录注册4.1、Markup Schema 案例4.2、JSON Schema 案例4.3、纯 JSX 案例 1、Form…

Amdahl 定律

Amdahl 定律是用来表示&#xff0c;当提高系统某部分性能时对整个系统的影响&#xff0c;其公式如下&#xff1a; a表示我们提升部分初始耗时比例&#xff0c;k是我们的提升倍率&#xff0c;通过这个公式我们可以轻松的得知对每一部分的提醒&#xff0c;对整个系统带来的影响…

Linux系统之美:环境变量的概念以及基本操作

本节重点 理解环境变量的基本概念学会在指令和代码操作上查询更改环境变量环境变量表的基本概念父子进程间环境变量的继承与隔离 一、引入 1.1 自定义命令&#xff08;我们的exe&#xff09; 我们以往的Linux编程经验告诉我们&#xff0c;我们在对一段代码编译形成可执行文件后…

pnpm 报错 Error: Cannot find matching keyid 解决

1. 查看corepack版本&#xff0c;升级至0.31.0 npm i -g corepack0.31.0 这里注意环境变量&#xff0c;可能升级后还是指向旧版本&#xff0c;可以选择更新环境变量或者删除原指向的corepack命令 2. 更新pnpm corepack install -g pnpmlatest 问题解决。