一、PyPy介绍
PyPy是用Python实现的Python解释器的动态编译器,是Armin Rigo开发的产品,能够提升我们python项目的运行速度。PyPy 是利用即时编译的 Python 的替代实现。背后的原理是 PyPy 开始时就像一个解释器,直接从源文件运行我们的 Python 代码。但是,PyPy 不是逐行运行代码,而是在执行它们之前将部分代码编译为机器代码。
根据官方文档的介绍可以看到,平均下来PyPy比CPython(也就是我们主流使用的python)快4.5倍:
PyPy除了速度快外,还有下面一些特点:
- 内存使用情况比cpython少
- gc策略更优化
- Stackless 协程模式默认支持,支持高并发
- 兼容性好,高度兼容cpython实现,基本可以无缝切换
- PyPy为许多平台和操作系统提供预编译的二进制文件:
二、PyPy安装
我们直接访问下载地址:www.pypy.org/download.ht… 下载对应的包使用即可。
下载完成后解压到任意目录然后加入到环境变量中:
然后在控制台中执行pypy
就可以开始使用它了:
三、PyPy和Python测试对比
我们可以通过一个简单的脚本来测试一下它们之间的性能差异,下面是一个循环3千万次的累乘计算:
import datetime
x = 0
start_time = datetime.datetime.now()
for i in range(30000000):
x += i * i
print('耗时:', datetime.datetime.now() - start_time)
复制代码
测试结果
python耗时: 0:00:03.357052
pypy耗时: 0:00:00.761932
复制代码
可以看到有近4.5倍的性能差距,这也符合PyPy官网介绍的。
四、PyPy注意事项
经过测试PyPy也有一些库是不支持的:
- pyinstrument
- sshtunnel
这只是我经常使用的一些库中发现不支持的库,但绝大部分的库都是支持的,比如Django、requests、pymysql
等。
另外,对于诸如numpy
、pandas
这类本身就是C语言开发的扩展时,PyPy的性能反而会更低,PyPy只对纯Python库有明显的性能提升。
最后在你决定要使用PyPy时,你应该思考你的项目是否有性能瓶颈,或者性能瓶颈是因为Python本身效率慢的问题。如果是后端接口项目(类似使用flask、django开发的后端)其性能瓶颈往往在SQL的执行和代码本身的逻辑问题上,而不是python执行慢导致的。所以即便你使用了PyPy也大概率不能解决你的性能问题。