Python使用Numba装饰器进行加速

news2024/12/26 22:17:19

Python使用Numba装饰器进行加速

  • 前言
  • 前提条件
  • 相关介绍
  • 实验环境
  • Numba装饰器进行加速
    • 未加速的代码
      • 输出结果
    • @numba.jit加速的代码
      • 输出结果

在这里插入图片描述

前言

  • 由于本人水平有限,难免出现错漏,敬请批评改正。
  • 更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
  • 基于DETR的人脸伪装检测
  • YOLOv7训练自己的数据集(口罩检测)
  • YOLOv8训练自己的数据集(足球检测)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
  • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
  • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
  • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
  • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

  • 熟悉Python

相关介绍

  • Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
  • Python是一种非常流行和强大的编程语言,它有很多优点,比如简洁、易读、灵活、跨平台、丰富的库等。但是,Python也有一些缺点,其中之一就是运行速度相对较慢。
  • Python为什么慢呢?这主要有以下几个原因:
    • Python是一种解释型语言,也就是说,它的代码在运行时才被解释器转换成机器语言,而不是像编译型语言那样,提前编译成可执行文件。这样就增加了运行时的开销,降低了执行效率。
    • Python使用了动态类型,也就是说,它的变量在运行时才确定类型,而不是像静态类型那样,提前声明类型。这样就增加了运行时的类型检查和转换,降低了执行效率。
    • Python使用了全局解释器锁(GIL),也就是说,它的多线程在同一时刻只能有一个线程执行,而不是像多核处理器那样,可以并行执行多个线程。这样就限制了Python的并发能力,降低了执行效率。
  • Python的运行速度可以通过一些方法进行优化和加速,比如:
    • 使用PyPy,这是一种基于JIT(即时编译)技术的Python解释器,它可以在运行时动态编译Python代码,提高执行效率。
    • 使用Numba,这是一种基于LLVM(低级虚拟机)技术的Python库,它可以将Python函数编译成机器码,提高执行效率。
    • 使用Cython,这是一种基于C语言的Python扩展,它可以将Python代码转换成C代码,提高执行效率。
    • 使用多进程,这是一种利用多核处理器的并行计算方法,它可以创建多个进程,避免GIL的限制,提高执行效率。
  • Numba是一个用于Python的开源即时编译器,它可以将Python代码编译为机器代码,从而提高Python代码的执行速度。
  • Numba的优缺点:
    • 优点:
      • Numba可以显著提高Python代码的执行速度,特别是在处理大量数据时。
      • Numba使用LLVM(低级虚拟机)技术将Python函数编译成机器码,从而避免了Python解释器的性能瓶颈。
      • Numba可以通过使用JIT(Just-In-Time)编译技术,将Python代码转换为机器代码,即当你调用Python函数时,你的全部或部分代码就会被转换为“即时”执行的机器码,它将以你的本地机器码速度运行,从而避免了Python解释器的性能瓶颈。
      • Numba支持多种CPU架构和操作系统,包括x86、ARM和PowerPC。
      • Numba可以与NumPy和SciPy等科学计算库无缝集成。
    • 缺点:
      • Numba只能加速一部分Python代码,例如数值计算密集型代码,而对于I/O密集型代码,Numba的加速效果不明显。
      • Numba需要对代码进行修改,以便使用其加速功能,这可能需要一些额外的工作。
      • Numba的性能取决于代码的质量和结构,因此需要一定的编程经验和技能。
  • 以下是一个简单的numba加速例子,它比较了使用numba和不使用numba的情况下,计算斐波那契数列的第n项的时间消耗。
import time
import numba

import warnings
warnings.filterwarnings('ignore')

# 不使用numba的函数
def fib(n):
    if n < 2:
        return n
    return fib(n-1) + fib(n-2)

# 使用numba的函数
@numba.jit
def fib_numba(n):
    if n < 2:
        return n
    return fib_numba(n-1) + fib_numba(n-2)

# 测试两个函数的运行时间
n = 40
start = time.time()
fib(n)
end = time.time()
print(f'不使用numba的时间:{end - start}秒')

start = time.time()
fib_numba(n)
end = time.time()
print(f'使用numba的时间:{end - start}秒')
不使用numba的时间:15.397910833358765秒
使用numba的时间:0.731497049331665秒

实验环境

  • Python 3.x (面向对象的高级语言)
  • Numba 0.58.1(Python第三方库)pip install numba -i https://pypi.tuna.tsinghua.edu.cn/simple
    在这里插入图片描述

Numba装饰器进行加速

未加速的代码

import time

def one_cycle():
    num = 0  
    for i in range(1, 1000000):  
        num +=i
    return num

def double_cycle():
    num = 0 
    for i in range(1000):  
        for j in range(1000):
            num +=i*j
    return num  
              
def triple_cycle():
    num = 0
    for i in range(100):  
        for j in range(100):  
            for k in range(100):
                num += i*j*k
    return num        

if __name__=="__main__":
    start_time = time.time()
    for i in range(100):
        one_cycle()
    end_time = time.time()
    print("one_cycle函数运行时间:",(end_time-start_time)/100)

    start_time = time.time()
    for i in range(100):
        double_cycle()
    end_time = time.time()
    print("double_cycle函数运行时间:",(end_time-start_time)/100)

    start_time = time.time()
    for i in range(100):
        triple_cycle()
    end_time = time.time()
    print("triple_cycle函数运行时间:",(end_time-start_time)/100)

输出结果

one_cycle函数运行时间: 0.021781625747680663
double_cycle函数运行时间: 0.031956143379211426
triple_cycle函数运行时间: 0.042625854015350344

@numba.jit加速的代码

import time
import numba

import warnings
warnings.filterwarnings('ignore')

@numba.jit
def one_cycle():
    num = 0  
    for i in range(1, 1000000):  
        num +=i
    return num

@numba.jit
def double_cycle():
    num = 0 
    for i in range(1000):  
        for j in range(1000):
            num +=i*j
    return num  
              
@numba.jit
def triple_cycle():
    num = 0
    for i in range(100):  
        for j in range(100):  
            for k in range(100):
                num += i*j*k
    return num        

if __name__=="__main__":
    start_time = time.time()
    for i in range(100):
        one_cycle()
    end_time = time.time()
    print("one_cycle函数运行时间:",(end_time-start_time)/100)

    start_time = time.time()
    for i in range(100):
        double_cycle()
    end_time = time.time()
    print("double_cycle函数运行时间:",(end_time-start_time)/100)

    start_time = time.time()
    for i in range(100):
        triple_cycle()
    end_time = time.time()
    print("triple_cycle函数运行时间:",(end_time-start_time)/100)

输出结果

one_cycle函数运行时间: 0.002056455612182617
double_cycle函数运行时间: 0.00046929597854614255
triple_cycle函数运行时间: 0.0007887816429138183
  • 由于本人水平有限,难免出现错漏,敬请批评改正。
  • 更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
  • 基于DETR的人脸伪装检测
  • YOLOv7训练自己的数据集(口罩检测)
  • YOLOv8训练自己的数据集(足球检测)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
  • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
  • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
  • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
  • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1194046.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

windows下安装zookeeper及kafka

1、下载安装包 https://dlcdn.apache.org/zookeeper/zookeeper-3.9.1/apache-zookeeper-3.9.1-bin.tar.gz 2、下载kafka包 Apache Kafka 3、解压压缩包 4、进入zookeeper目录创建配置的数据目录data及配置的日志目录log 5、复制并配置zoo.cfg文件 6、启动zookeeper&#xff0…

Python数据容器(字符串)

字符串 1.字符串 字符串也是数据容器的一种&#xff0c;字符串是字符的容器&#xff0c;一个字符串可以存放任意数量的字符。 2.字符串的下标索引 从前向后&#xff0c;下标从0开始从后向前&#xff0c;下标从-1开始 # 通过下标索引获取特定位置的字符 name python print(na…

【数据结构】树的基本性质(计算树的总结点数与叶结点数)

树的基本性质 ⭐️计算树的总结点与叶结点数&#x1f4ab;性质1&#x1f4ab;性质2&#x1f4ab;例题1&#x1f4ab;例题2 ⭐️计算树的总结点与叶结点数 &#x1f4ab;性质1 性质1 树中的结点数等于所有结点的度数之和加1 例如上面这棵树&#xff0c;A的孩子为B、C、D&…

如何在苹果iOS系统ipa应用中获取当前版本号和Bundle ID

在iOS应用开发过程中&#xff0c;了解如何获取和使用应用的当前版本号、Bundle ID和其他相关信息是至关重要的。无论是在应用内显示这些信息&#xff0c;还是在编写一些版本依赖的逻辑时&#xff0c;掌握这些知识点都将帮助开发者进行更有效的管理和维护。本文将详细介绍如何在…

Java程序设计实验5 | Java API应用

*本文是博主对Java各种实验的再整理与详解&#xff0c;除了代码部分和解析部分&#xff0c;一些题目还增加了拓展部分&#xff08;⭐&#xff09;。拓展部分不是实验报告中原有的内容&#xff0c;而是博主本人自己的补充&#xff0c;以方便大家额外学习、参考。 &#xff08;解…

【Java 进阶篇】Java Web 开发之 Listener 篇:ServletContextListener 使用详解

欢迎大家来到 Java Web 开发的学习之旅&#xff01;在前面的博客中&#xff0c;我们已经学习了 Servlet、JSP、Filter 等重要的概念和技术。今天&#xff0c;我们将深入探讨 Java Web 开发中另一个重要的组成部分——Listener&#xff08;监听器&#xff09;&#xff0c;具体来…

18 CDN详解

1、理解CDN 1.CDN 和电商系统的分布式仓储系统一样&#xff0c;就近发货给客户(客户端)&#xff0c;所以&#xff0c;必然是提前在仓库中存储了某些商品. 2.CDN最擅长的是缓存静态数据&#xff0c;比如电商系统的热点静态页面&#xff0c;秒杀场景的页面等.问题&#xff1a;向…

Linux学习第37天:Linux I2C 驱动实验(一):哥俩好

Linux版本号4.1.15 芯片I.MX6ULL 大叔学Linux 品人间百味 思文短情长 世界上的很多事物都是成双成对出现的。也包括在驱动开发的过程中&#xff0c;比如I2C中其实就是数据线和时钟线的相互配合才能完成的。 I2C常用于连接各种外设、…

基于SSM的网络音乐系统的设计与实现

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;Vue 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#xff1a;是 目录…

【Vue】【uni-app】工单管理页面实现

用的是uni-app的uni-ui拓展组件实现的 功能是对工单进行一个展示&#xff0c;并对工单根据一些筛选条件进行搜索 目前是实现了除了日期之外的搜索功能&#xff0c;测试数据是下面这个tableData.js&#xff0c;都是我自己手写的&#xff0c;后端请求也稍微写了一些&#xff0c;…

Windows上基于Tesseract OCR5.0官方语言库的LSTM字库训练

系列文章目录 Tesseract OCR引擎 文章目录 系列文章目录前言一、LSTM字库训练是什么&#xff1f;二、使用步骤1. 环境准备1.1下载Tesseract 程序并安装1.2下载Tesseract 训练字库1.3下载工具jTessBoxEditor 2. LSTM训练2.1 将要训练的图片(jpg/tif)合并成一个文件2.2 生成box文…

DreamScene2 免费WIndows 动态桌面壁纸播放软件启动无响应失败问题解决及安装使用帮助

高阶使用预览 启动失败场景还原 1. 系统信息 2. 启动错误描述 使用壁纸过程中突然出现异常卡断,使用任务管理器停止程序后,该程序就无法正常启动,点及启动后出现 转圈(任务管理器短暂出现进程) 后就消失不见 原因分析 经过推测后可能是 强制停止后 工作临时缓存目录与启动程序…

2023.11.10联赛 T3题解

题目大意 题目思路 感性理解一下&#xff0c;将一个数的平方变成多个数平方的和&#xff0c;为了使代价最小&#xff0c;这些数的大小应该尽可能的平均。 我们可以将 ∣ b i − a i ∣ |b_i-a_i| ∣bi​−ai​∣放入大根堆&#xff0c;同时将这个数划分的次数以及多划分一段减…

IDEA的这款API调试插件爱了

前言 Idea 是一款功能强大的集成开发环境&#xff08;IDE&#xff09;&#xff0c;它可以帮助开发人员更加高效地编写、调试和部署软件应用程序,Idea 还具有许多插件和扩展&#xff0c;可以根据开发人员的需要进行定制和扩展&#xff0c;从而提高开发效率,今天我们就来介绍一款…

【FastCAE源码阅读7】视图方向切换按钮实现原理

在FastCAE工具栏上有视图切换按钮&#xff0c;如下图所示&#xff1a; 本文介绍如何实现。 FastCAE集成了Python解析器&#xff0c;当单击按钮时&#xff0c;中间用Python执行的&#xff0c;最后调用MainWindow.dll库接口实现的。 具体的Python代码在Python模块的py文件夹下的…

统一消息分发中心设计

背景 我们核心业务中订单完成时&#xff0c;需要完成后续的连带业务&#xff0c;扣件库存库存、增加积分、通知商家等。 如下图的架构&#xff1a; 这样设计出来导致我们的核心业务和其他业务耦合&#xff0c;每次新增连带业务或者去掉连带业务都需要修改核心业务。 一方面&…

linux服务-配置ntp时间服务

参考博文&#xff1a; 如何部署NTP服务器 NTP时间服务器安装部署文档 NTP时间服务器部署以及时间同步设置 Centos7搭建NTP服务器及客户端同步时间 参考文档&#xff1a; GB_T 20520-2006 信息安全技术 公钥基础设施 时间戳规范&#xff1b; GM_T0033-2014 时间戳接口规范&…

芯片静态电流详细测试流程,纯干货分享

在芯片的众多测试项目中芯片的功耗测试可谓重中之重&#xff0c;因为芯片的功耗不仅关系着芯片的整体工作性能也对芯片的工作效率有着非常重大的影响。今天纳米软件就带你了解一下芯片测试项目功耗测试中的静态电流的测试。 01、什么是芯片的静态电流? 芯片的静态电流也叫做…

基于SSM的课程管理系统

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;Vue 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#xff1a;是 目录…

CSS 移动端 1px(线条/边框) 不同机型上显示粗细不同,解决办法

由于不同的手机有不同的像素密度导致的。如果移动显示屏的分辨率始终是普通屏幕的2倍&#xff0c;1px的边框在devicePixelRatio2的移动显示屏下会显示成2px&#xff0c;所以在高清瓶下看着1px总是感觉变胖了 <!DOCTYPE html> <html lang"en"> <head&g…