加载速度提升 15%，关于 Python 启动加速探索与实践的解析 | 龙蜥技术

加载速度提升 15%，关于 Python 启动加速探索与实践的解析 | 龙蜥技术

news2026/2/16 17:39:32

编者按：在刚刚结束的 PyCon China 2022 大会上，龙蜥社区开发者严懿宸分享了主题为《Python 启动加速的探索与实践》的技术演讲。本次演讲，作者将从 CPython 社区相关工作、本方案的设计及实现，以及业务层面的集成等方面进行介绍。

以下为本次演讲内容：

一、Python 启动速度简析

首先从一个 Python 3 中空解释器启动时间的好事分析开始。我们可以看到，主要的耗时都和 Python 包加载有关。

其中，CPU 时间中包加载占据了 30% 左右的时间；而 37% 的等待时间中，磁盘 IO 等花费的时间也和包加载有较大的关联。

熟悉 Python 机制的朋友大概知道，Python 中加载一个包首先会搜索对应的 pyc 文件，这是一种序列化的字节码格式。找到之后会对其进行反序列化，并执行其中的代码。如对应的 pyc 文件不存在，会重新编译 py 文件得到字节码，并序列化为 pyc 文件持久化保存。我们优化的主要目标主要集中在加载包这个过程，希望能够至少免去每次查找、读取、反序列化的开销。

以 Python3.10 为例，这里是使用 python 解释器启动一个空语句的所需时间，同时使用了 -Ximporttime 打印出过程中加载每一个包的耗时。可以粗略地看到，包加载时间大约占了总时间的 30% 左右。我们发现这种情况和 Java 虚拟机类似。在 Java 中，Java 会首先将 Java 源代码编译为 Java 字节码，随后由 Java 命令执行。

我们知道 Java 的优势并不包括启动速度，这种流程也是原因之一。那么 Java 如何部分解决这个问题呢？

二、PyCDS （代码对象共享）设计与实现

Java 中有一个叫做 CDS/AppCDS 的机制，通过将 Java 字节码和一些辅助数据持久化保存，在后续启动时使用 mmap 加载，节约了磁盘 IO 和解析验证 class 文件的开销。

很自然的想法是，如果我们希望在 Python 中使用类似的技术，目标应该是 Python 字节码。

Python 默认从 py 文件导入模块的逻辑如上图左边所示，首先根据制定的名字获取对应的规则，随后尝试寻找 pyc 文件或重新编译。最后，使用 exec 命令利用代码和一个空 dict 来创建模块，并加入 runtime。

我们做的事情可以简化为右侧逻辑。同样根据包名，尝试从 mmap 中加载。如果成功，那么同样的 codeobject 也可以用于初始化。

这样做有什么直接的障碍？

可以看到，Python 中代码对象的 C 数据结构大致如图，包括 consts、string、bytes 等 Python 数据类型。

以使用到的 codeobject 作为 root，将涉及的数据序列化存储到内存映射中。

在这一步，最直接的问题是内存随机化机制。在处理 code object 中的 Python 对象时，每个 Python 对象头中都保存着指向当前进程中对应类型信息的指针。Runtime 通过这个指针判断该对象在 Python 中的类型。

以 PyCode_Type 为例，如果不做处理，这里会丢失类型信息（红色 offset）。

为了解决这个问题，在我们创建的镜像文件中会保存涉及的对象指针。在加载时动态 patch 相关的指针。

在整个过程中涉及的 Python 类型包括：

1. 常量（bool/None/ellipsis）

2. 字面量（float/complex）

3. 需要额外分配的变量（long/bytes/str）

4. container（tuple/frozenset）

对于常量和字面量，在内存映射中分配好空间后直接赋值即可保存；对于后两种，需要模拟 Python 中变量初始化的逻辑，创建合适的内存大小并写入对应位置。同时，对于非常量的类型，还需要对内存映射中的引用计数额外赋值，防止意外触发 Python 中的回收。

以上就是本项目的大致内容，另外关于项目的具体用法请前往 PyCDS 项目主页或我们在龙蜥实验室上的课程查看，链接见下：

龙蜥实验室课程：lab.openanolis.cn/#/apply/chapters?courseId=117

PyCDS 主页：github.com/alibaba/code-data-share-for-python

—— 完 ——

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/108605.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Python基础知识入门（四）

Python基础知识入门（四）

Python基础知识入门（一） Python基础知识入门（二） Python基础知识入门（三） 一、条件控制条件语句是通过一条或多条语句的执行结果（True 或者False）来决定执行的代码块。注意&…

阅读更多...

使用CMake编译基于OpenCV开发的程序的方法

使用CMake编译基于OpenCV开发的程序的方法

方法使用CMake编译OpenCV开发的程序分为以下几个步骤： 安装编译器和代码编辑器。 Windows安装Visual Studio社区版，集成了编译器和代码编辑器。Ubuntu安装gcc、g和VSCode： sudo apt install gcc gcmacOS安装XCode Commandline Tools和VS…

阅读更多...

R语言应用xgboost进行机器学习（1）

R语言应用xgboost进行机器学习（1）

XGBoost 机器学习模型是一种高效且可扩的展的机器学习分类器，由 Chen 和 Guestrin 在 2016 年推广。XGBoost原理是是在决策树的基础上产生迭代，它以 boosting 的方式结合了多个决策树。通常创建每棵新树是为了通过梯度提升来减少先前模型的误差&#xff…

阅读更多...

鸿翼档案，将非结构化数据治理能力应用于档案管理的先行者

鸿翼档案，将非结构化数据治理能力应用于档案管理的先行者

数字化时代，每个人每天都要接触大量的数据。人们通过分析数据获取信息与知识，帮助自身更好地理解社会动向，掌握行业发展。我们每天都会接触到多种多样的数据，这些数据根据结构可划分为三种：结构化数据、非结构化数据和…

阅读更多...

Android设计模式详解之责任链模式

Android设计模式详解之责任链模式

前言责任链模式是行为型设计模式； 定义：使多个对象都有机会处理请求，从而避免了请求的发送者和接收者之间的耦合关系。将这些对象连成一条链，并沿着这条链传递该请求，直到有对象处理它为止。使用场景：…

阅读更多...

基于概率论的MATLAB仿真,内容包括非共轭条件下的后验概率的推导,共轭条件下的非完备集的后验概率的推导

基于概率论的MATLAB仿真,内容包括非共轭条件下的后验概率的推导,共轭条件下的非完备集的后验概率的推导

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 1.1先验概率的推导根据贝叶斯概率论可知，某一事件的后验概率可以根据先验概率来获得，因此，这里首先对事件的先验概率分布进行理论的推导。假设测量的腐蚀数据…

阅读更多...

[一个无框架的javaweb demo]番荒之冢 --番剧灯塔站

[一个无框架的javaweb demo]番荒之冢 --番剧灯塔站

文章目录番荒之冢 --番剧灯塔站理念大致设计权限分配番剧信息用户/管理员信息邮箱正则匹配URL正则匹配留言信息数据库设计useranimationcommentfavoranim技术栈(无框架)功能一个简单的登录(进行了路由限制, 若未登录都会跳转至此)首页我的我的资料追番清单留言区番剧详情退出登…

阅读更多...

华为云-计算云服务介绍

华为云-计算云服务介绍

前言相信很多小伙伴在刚开始接触各类云产品的时候，被各种各样的云产品类如规格、型号、价格、适用场景等问题所困扰。本文就给大家介绍一下华为云常见云产品的规格区别和适用场景。帮助大家选择合适的云产品。文章目录前言一、计算云服务1.弹性云服务器2.裸金属服…

阅读更多...

Apache Flink 部署模式

Apache Flink 部署模式

目录会话模式 Session Mode 单作业模式 Per-Job Mode (deprecated) 应用模式 Application Mode 在一些应用场景中，对于集群资源分配和占用的方式，可能会有特定的需求。Flink 为各种场景提供了不同的部署模式，主要有以下三种： i…

阅读更多...

ArcGIS | NetCDF数据在ArcMap中的使用

ArcGIS | NetCDF数据在ArcMap中的使用

NetCDF又称科学数据集，可以存储温度、湿度、风速、风向等多个维度的文件格式。以中国区域地面气象要素驱动数据集为例进行介绍。中国区域地面气象要素驱动数据集，包括近地面气温、近地面气压、近地面空气比湿、近地面全风速、地面向下短波辐射、地面向…

阅读更多...

P6 PyTorch 常用数学运算

P6 PyTorch 常用数学运算

前言： 这里主要介绍一下PyTorch 的常用数学运算目录： 1： add|sub 加减法 2: mul/div 乘/除运算 3: 矩阵乘法 4 2D矩阵转置 5 其它常用数学运算 6 clamp 梯度剪裁一加减法 1.1 加法可以直接通过符号或者 torch.add # -*- co…

阅读更多...

MySQL数据库的安装、创建库及连接取数

MySQL数据库的安装、创建库及连接取数

安装MySQL数据库MySQL数据库简介安装MySQL数据库下载安装包安装MySQLMySQL创建一个新的数据库，并在其中创建新的数据表，填充测试数据并查看mysql>模式下输入的每句sql语句都要以;结尾；若多行语句无;，则被默认为一条语句未输入完…

阅读更多...

UNIX环境高级编程——1.UNIX基础知识

UNIX环境高级编程——1.UNIX基础知识

UNIX基础知识 UNIX体系结构严格意义上来说，可以将操作系统定义为一种软件，控制计算机硬件资源，提供程序运行环境。通常把这种软件成为内核。内核的接口被成为系统调用（system call）。公共函数库构建在系统调用接口之…

阅读更多...

碳酸锂、碳酸氢锂除钙镁离子交换柱

碳酸锂、碳酸氢锂除钙镁离子交换柱

锂及其盐类是国民经济和国防建设中具有重要意义的战略物资，也是与人们生活息息相关的能源材料。而碳酸锂作为锂盐的基础盐，是制取锂化合物和金属锂的原料，可作铝冶炼的电解浴添加剂，亦可用于合成橡胶、染料、半导体等方面。电池级…

阅读更多...

Orin+ GMSL （Ser 9295+Des 9296）流程分析（1）

Orin+ GMSL （Ser 9295+Des 9296）流程分析（1）

文章目录 1 前言2 流程分析2.1 整体架构2.2 Ser端2.2 Des端2.3 软件架构2.4 设备树文件分析2.5 VI 接口2.7 CSI 接口1 前言 Maxim 支持GMSL作为汽车行业视频应用的通信链路。GMSL基于SerDes (Serializer-Deserializer)技术;也就是说，它在发送端使用序列化器，在接收端使用反序…

阅读更多...

观察UE4中引用查看器(ReferenceViewer)是从哪得到数据的

观察UE4中引用查看器(ReferenceViewer)是从哪得到数据的

前言引用查看器(ReferenceViewer)可以显示资源引用关系数据，我想要知道这个数据是如何得到的。因此从它的界面代码开始一步步往里看。 （到最后才发现，得到引用关系数据的接口很简单，而且是蓝图可访问的，详见本篇的【…

阅读更多...

冬至已至，你的在职读研2023能在社科院与杜兰大学金融管理硕士项目实现吗

冬至已至，你的在职读研2023能在社科院与杜兰大学金融管理硕士项目实现吗

杜甫《小至》中写道“天时人事日相催，冬至阳生春又来”。不知不觉间冬至悄然到来，过完冬至天气日渐回暖，春天即将回来了。时光总是匆匆而逝，一晃2022年将要与我们说再见了。这一年来，反复无常的疫情，瞬息万…

阅读更多...

【学习笔记】JDK源码学习之HashTable(附带面试题)

【学习笔记】JDK源码学习之HashTable(附带面试题)

【学习笔记】JDK源码学习之HashTable(附带面试题) 其他好文： 【学习笔记】JDK源码学习之LinkedHashMap（附带面试题【学习笔记】JDK源码学习之HashMap（附带面试题）【学习笔记】JDK源码学习之Vector（附带面试题&#x…

阅读更多...

OpenCV基础入门

OpenCV基础入门

主要了解包括 opencv 的下载和环境配置opencv目录的了解opencv中highgui模块opencv中core模块opencv中imgproc模块opencv中feature2d模块opencv视频操作 1.OpenCV简介图像是人类视觉的基础，是自然景物的客观反映。模拟图像通过某种物理量的强弱变化来记录图像…

阅读更多...

中小企业远程办公指南：10分钟搭建，即插即用

中小企业远程办公指南：10分钟搭建，即插即用

不装了我成小阳人了虽然还没算过来人，但是想要提醒一下小伙伴“能不阳就别阳”，“能晚阳就晚阳”！ 真的很痛很难受。为了应对即将到来的高峰，我们在上周末紧急采取了远程居家办公模式。不得不说，公司应对突发情…

阅读更多...

推荐文章

最新文章