【Python】pyinstaller全新的打包方案,堪称完善!

news2024/10/6 6:00:35

文章目录

  • 前言
  • 一、pandas是什么?
  • 二、使用步骤
  • -*- mode: python ; coding: utf-8 -*-
  • 剩下的项就省略了
  • -*- mode: python ; coding: utf-8 -*-
  • 用一个函数选择性对依赖文件目标路径改名
  • 打印 a.binaries,检查依赖文件目标路径
  • 剩下的省略了
  • 2. 第二步:打包可修改程序
  • coding: utf-8
  • coding: utf-8
  • 除此之外,a 还有一些没有列出的属性:
  • pure 是一个列表,包含了所有纯 Python 模块的信息,这些模块会被打包到一个 .pyz 文件中。
  • scripts 是一个列表,包含了你的 Python 脚本的信息。这些脚本会被打包到一个 exe 文件中。
  • 用一个函数选择性对依赖文件目标路径改名
  • 打印 a.pure,显示哪些 py 文件被打包
  • -*- mode: python ; coding: utf-8 -*-
  • 用一个函数选择性对依赖文件目标路径改名,重定向到 libs 文件夹
  • 将需要排除的模块写到一个列表(不带 .py)
  • 将被排除的模块添加到 a.datas
  • 筛选 a.pure
  • 打印 a.dates ,显示哪些文件被复制到打包文件夹
  • 总结


前言

在这里插入图片描述

一、pandas是什么?

如果我要写一个 Python 项目,打包成 exe 运行(方便在没有 Python 的电脑上使用),我需要打包出的根目录结构美观,没有多余的、杂乱的依赖文件在那里碍眼,而且需要在发现 bug 时,我还需要能够修改里面的代码后,无需再次打包,就能正常运行,该怎么做呢?

就以一个 Hello 项目为例,记一下我找到的完美方法。最新代码已经放到,欢迎参阅:https://github.com/HaujetZhao/PyInstaller-Perfect-Build-Method

首先,新建项目文件夹,写一个 hello.py:
在这里插入图片描述
在这里插入图片描述
用 PyInstaller 把 hello.py 打包,pyinstaller ./hello.py 命令会得到 build 和 dist 文件夹,以及 hello.spec 文件:

在这里插入图片描述
其中:

build 文件夹是存放打包时临时文件用的

dist 文件夹存放了打包好的应用

hello.spec 内容是 PyInstaller 根据我们的命令行生成的打包参数

打开 dist/hello 文件夹,可以看到我们打包好的 hello.exe 躺在一堆依赖文件之间,非常丑陋:

在这里插入图片描述
我们的目标,就是要把这些依赖包都移到一个子文件夹中,让打包文件夹变得整洁,同时让程序正常运行。

最后我们可以打包成这个样子:
在这里插入图片描述
首先,所有的依赖模块都被移动到了 libs 文件夹,整个打包根目录清清爽爽,只留下了必要的 python310.dll 和 base_library.zip。

其次,如你所见,这个程序的脾气不是太好,出口成脏,我们希望用户在拿到这个开源程序时,可以修改脚本的内容,不需要重新打包就能直接从 hello.exe 运行。因此我们要把 hello.exe 做成程序入口,实际的逻辑写在 hello_main.py ,同时要确保 hello_main.py 中的依赖都被正确打包到 libs 文件夹。

我们一步步解决。

二、使用步骤

1.1 生成 spec 文件
达到目的的关键在于用命令行打包时自动生成的 hello.spec ,它的本质是一个 python 文件,pyinstaller 有两种运行模式:

pyinstaller hello.spec 会使用 spec 文件中的配置进行打包

pyinstaller hello.py 根据命令行参数自动生成 spec 文件,再依据使用 spec 文件中的配置进行打包

pyinstaller 在打包时,实际上是在做了一些准备工作后,直接运行了 spec 文件里的 Python 代码。

相比于给命令行添加参数,直接编辑 spec 文件,在里面保存参数,更优雅,更方便操作。

除了直接打包脚,本文件自动生成 spec 配置,还可以通过执行 pyi-makespec hello.py 不打包,只生成 spec 配置。

1.2 解释 spec 文件
打开 hello.spec 文件,有如下内容(已作注释):
在这里插入图片描述
1.3 加入 Hook
通过对 spec 文件的了解,我们知道了,可以在 a.runtimehooks 列表中加入 python 脚本 hook ,它会在我们的主代码执行之前运行,为我们准备环境。

在这个 hook 里面,我们就可以修改 sys.path ,自定义 Python 查找模块的路径,或者环境变量

那我们就写一个 hook.py

import sys
from pprint import pprint

print(f’\n\n模块查找路径:')
pprint(sys.path)

print(‘\n’)
在这里插入图片描述
然后,用 pyinstaller hello.spec 进行打包,再执行得到的 hello.exe,得到如下输出:
在这里插入图片描述
可见 hook.py 确实在 hello.py 之前运行了,且打印出了 sys.path ,即模块查找路径,有三个:

dist/hello/base_library.zip 这个是程序所在目录的 base_library.zip 文件

dist/hello/lib-dynload 这个是运行程序时动态生成的

dist/hello/ 这个是程序所在目录

1.4 hook 修改 sys.path
因此,我们就可以在打包输出文件夹中新建一个 libs 文件夹,将所有的依赖文件全都放进去,然后在 hook.py 里把 libs 路径加入 sys.path ,然后我们的脚本运行时就正确搜索到依赖包了。

改写 hook.py

import sys
from pathlib import Path
from pprint import pprint

BASE_DIR = Path(file).parent

for p in sys.path.copy():
relative_p = Path§.relative_to(BASE_DIR)
new_p = BASE_DIR / ‘libs’ / relative_p
sys.path.insert(0, str(new_p))

print(f’\n\n模块查找路径:')
pprint(sys.path)

print(‘\n’)
然后,用 pyinstaller hello.spec 进行打包,再执行得到的 hello.exe,得到如下输出:

在这里插入图片描述
从输出可以看到模块查找路径,已经修改成功,新增了 libs 文件夹。

既然模块查找路径添加成功。那我们就 手动 把所有的依赖文件都移动到 libs 子文件夹中,再运行 hello.exe ,完美运行:
在这里插入图片描述
需要注意的是:由于 hook 也是 python 脚本,运行 hook 需要 python 环境,所以 python310.dll 和 base_library.zip 不能移动到 libs 文件夹中。

我用的 Python 版本是3.10,所以会有一个 python310.dll,具体的文件名会随你安装的 Python 版本而变化

1.5 查看依赖目标位置
虽然我们在打包后将依赖文件移动到 libs 文件夹,程序能正常运行,但是我们肯定不希望每次打包都要 手动 移动一次。

实际上我们可以在 spec 文件中定义依赖文件和二进制文件的存放位置。

pyinstaller 在执行 spec 文件中的代码时,自动分析找到所需的依赖文件后,会把他们的目标路径和原始路径写到 a.binaries ,我们可以把它打印出来看一下。

修改 hello.spec 文件

-- mode: python ; coding: utf-8 --

block_cipher = None

a = Analysis(
[‘hello.py’],
pathex=[],
binaries=[],
datas=[],
hiddenimports=[],
hookspath=[],
hooksconfig={},
runtime_hooks=[‘hook.py’],
excludes=[],
win_no_prefer_redirects=False,
win_private_assemblies=False,
cipher=block_cipher,
noarchive=False,
)

from pprint import pprint
pprint(a.binaries) # 打印 a.binaries

pyz = PYZ(a.pure, a.zipped_data, cipher=block_cipher)

exe = EXE(
pyz,
a.scripts,
[],
exclude_binaries=True,
name=‘hello’,
debug=False,
bootloader_ignore_signals=False,
strip=False,
upx=True,
console=True,
disable_windowed_traceback=False,
argv_emulation=False,
target_arch=None,
codesign_identity=None,
entitlements_file=None,
)
coll = COLLECT(
exe,
a.binaries,
a.zipfiles,
a.datas,
strip=False,
upx=True,
upx_exclude=[],
name=‘hello’,
)
然后,用 pyinstaller hello.spec 进行打包过程中得到如下输出:

[(‘api-ms-win-crt-runtime-l1-1-0.dll’,
‘C:\Portable_library\java\jdk-14.0.1\bin\api-ms-win-crt-runtime-l1-1-0.dll’,
‘BINARY’),
(‘python310.dll’,
‘C:\Users\Haujet\AppData\Local\Programs\Python\Python310\python310.dll’,
‘BINARY’),
(‘api-ms-win-crt-heap-l1-1-0.dll’,
‘C:\Portable_library\java\jdk-14.0.1\bin\api-ms-win-crt-heap-l1-1-0.dll’,
‘BINARY’),
(‘VCRUNTIME140.dll’,
‘C:\Users\Haujet\AppData\Local\Programs\Python\Python310\VCRUNTIME140.dll’,
‘BINARY’),

剩下的项就省略了

]
可以看到,a.binaries 是一个列表,其中的元素是元组,元组有3个内容:

依赖文件目标路径

依赖文件原始路径

文件类型

我们只需要修改 a.binaries ,在目标路径前加上 libs 就可以了,同时,要确保 python310.dll 和 base_library.zip 不被修改。

1.6 修改依赖目标位置
编辑 hello.spec 文件:

-- mode: python ; coding: utf-8 --

block_cipher = None

a = Analysis(
[‘hello.py’],
pathex=[],
binaries=[],
datas=[],
hiddenimports=[],
hookspath=[],
hooksconfig={},
runtime_hooks=[‘hook.py’],
excludes=[],
win_no_prefer_redirects=False,
win_private_assemblies=False,
cipher=block_cipher,
noarchive=False,
)

import re
import os

用一个函数选择性对依赖文件目标路径改名

def new_dest(package: str):
if package == ‘base_library.zip’ or re.match(r’python\d+.dll’, package):
return package
return ‘libs’ + os.sep + package

a.binaries = [(new_dest(x[0]), x[1], x[2]) for x in a.binaries]

打印 a.binaries,检查依赖文件目标路径

from pprint import pprint
pprint(a.binaries)

pyz = PYZ(a.pure, a.zipped_data, cipher=block_cipher)

exe = EXE(
pyz,
a.scripts,
[],
exclude_binaries=True,
name=‘hello’,
debug=False,
bootloader_ignore_signals=False,
strip=False,
upx=True,
console=True,
disable_windowed_traceback=False,
argv_emulation=False,
target_arch=None,
codesign_identity=None,
entitlements_file=None,
)
coll = COLLECT(
exe,
a.binaries,
a.zipfiles,
a.datas,
strip=False,
upx=True,
upx_exclude=[],
name=‘hello’,
)
然后,用 pyinstaller hello.spec 进行打包,再执行得到的 hello.exe,得到如下输出:

[(‘libs\VCRUNTIME140.dll’,
‘C:\Users\Haujet\AppData\Local\Programs\Python\Python310\VCRUNTIME140.dll’,
‘BINARY’),
(‘python310.dll’,
‘C:\Users\Haujet\AppData\Local\Programs\Python\Python310\python310.dll’,
‘BINARY’),
(‘libs\_decimal.pyd’,
‘C:\Users\Haujet\AppData\Local\Programs\Python\Python310\DLLs\_decimal.pyd’,
‘EXTENSION’),

剩下的省略了

]
得到了干净的输出目录, hello.exe 也能够正常运行:

在这里插入图片描述
但是如你所见,这个程序脾气不好,爆粗口,用户可能会想要修改其中的代码,但又不想配置环境、重新打包。

因此接下来我们就要把 hello.exe 作为程序入口,实际的逻辑写在 hello_main.py ,同时确保 hello_main.py 中的依赖都被正确打包到 libs 文件夹。这样,用户就可以通过编辑 hello_main.py 来修改程序行为了。

2. 第二步:打包可修改程序

2.1 制作入口
新建文件 hello_main.py ,将 hello.py 的代码逻辑复制进去,并且要稍作修改:

coding: utf-8

from rich import print

def main(*args, **kwargs):

print('[red]Hello mother fucker! ')
input('按下回车继续')

if name == “main”:
main()
然后修改 hello.py,将其制作成程序入口,调用 hello_main.py 中的 main 函数:

coding: utf-8

import hello_main

hello_main.main()

在这里插入图片描述
然后,用 pyinstaller hello.spec 进行打包,但是我们会发现,打包出的程序与之前一模一样,虽然打包出的 hello.exe 能正常运行,但是我们却找不到 hello_main.py :

2.2 查看被打包的 py 模块
找不到 hello_main.py 的原因是,它被打包进了 hello.exe 中,所有被引用到的 py 文件都会被打包进 exe 文件中。

我们回顾一下开头 spec 文件中内容的注释:

除此之外,a 还有一些没有列出的属性:

pure 是一个列表,包含了所有纯 Python 模块的信息,这些模块会被打包到一个 .pyz 文件中。

scripts 是一个列表,包含了你的 Python 脚本的信息。这些脚本会被打包到一个 exe 文件中。

hello.py 是主脚本,会被加到 a.scripts 列表中,进而打包到 exe 中,hello_main.py 则是作为被导入的 py 模块,被加到了 a.pure 列表,后序被打包到 pyz 中。我们可以编辑 hello.spec,在打包过程中显示出有哪些 py 文件被打包了:

a = Analysis(
[‘hello.py’],
pathex=[],
binaries=[],
datas=[],
hiddenimports=[],
hookspath=[],
hooksconfig={},
runtime_hooks=[‘hook.py’],
excludes=[],
win_no_prefer_redirects=False,
win_private_assemblies=False,
cipher=block_cipher,
noarchive=False,
)

import re
import os

用一个函数选择性对依赖文件目标路径改名

def new_dest(package: str):
if package == ‘base_library.zip’ or re.match(r’python\d+.dll’, package):
return package
return ‘libs’ + os.sep + package

a.binaries = [(new_dest(x[0]), x[1], x[2]) for x in a.binaries]

打印 a.pure,显示哪些 py 文件被打包

from pprint import pprint
pprint(a.pure)

pyz = PYZ(a.pure, a.zipped_data, cipher=block_cipher)

… # 后面的代码省略了
然后,用 pyinstaller hello.spec 进行打包,在输出中可以搜索到:

[

(‘http.cookiejar’, ‘…\Python310\lib\http\cookiejar.py’, ‘PYMODULE’),
(‘hello_main’, ‘D:\PyInstaller优雅打包\hello_main.py’, ‘PYMODULE’),
(‘rich’, ‘…Python310\lib\site-packages\rich\init.py’,‘PYMODULE’),

]
hello_main 赫然在列。

2.3 阻止 py 模块被打包
既然 hello_main.py 是因为被自动加入到 a.pure 列表导致被打包的,那我们就可以在 spec 文件中将它从 a.pure 中剔除。

此外,我们还需要将 hello_main.py 添加到 a.datas 列表中,将它作为普通文件被复制到打包文件夹,编辑 hello.spec :

-- mode: python ; coding: utf-8 --

block_cipher = None

a = Analysis(
[‘hello.py’],
pathex=[],
binaries=[],
datas=[],
hiddenimports=[],
hookspath=[],
hooksconfig={},
runtime_hooks=[‘hook.py’],
excludes=[],
win_no_prefer_redirects=False,
win_private_assemblies=False,
cipher=block_cipher,
noarchive=False,
)

import re
import os

用一个函数选择性对依赖文件目标路径改名,重定向到 libs 文件夹

def new_dest(package: str):
if package == ‘base_library.zip’ or re.match(r’python\d+.dll’, package):
return package
return ‘libs’ + os.sep + package

a.binaries = [(new_dest(x[0]), x[1], x[2]) for x in a.binaries]

将需要排除的模块写到一个列表(不带 .py)

my_modules = [‘hello_main’, ]

将被排除的模块添加到 a.datas

for name in my_modules:
source_file = name + ‘.py’
dest_file = name + ‘.py’
a.datas.append((source_file, dest_file, ‘DATA’))

筛选 a.pure

a.pure = [x for x in a.pure if x[0] not in my_modules]

打印 a.dates ,显示哪些文件被复制到打包文件夹

from pprint import pprint
pprint(a.datas)

pyz = PYZ(a.pure, a.zipped_data, cipher=block_cipher)

exe = EXE(
pyz,
a.scripts,
[],
exclude_binaries=True,
name=‘hello’,
debug=False,
bootloader_ignore_signals=False,
strip=False,
upx=True,
console=True,
disable_windowed_traceback=False,
argv_emulation=False,
target_arch=None,
codesign_identity=None,
entitlements_file=None,
)
coll = COLLECT(
exe,
a.binaries,
a.zipfiles,
a.datas,
strip=False,
upx=True,
upx_exclude=[],
name=‘hello’,
)
此时,hook.py 中的 print 语句可以删掉了。

然后,用 pyinstaller hello.spec 进行打包,输出中得到:

2.4 编辑 py 后再运行
现在,用户就可以编辑 hello_main.py 后直接从 hello.exe 运行了,不需要重新打包(需要引入新库的情况除外)。

用户终于可以动手把这个脾气暴躁的程序教育成一个健康积极的程序了:

总结

此外,还可以进一步修改 hello.spec ,进而得到更完善的程序,例如导入额外的包、添加图标、添加其他资源。

这就是一个打包程序的模板了。

在此之外,其实还需要做一些改动。由于 pyinstaller 默认会把所有依赖的 py 文件打包到 exe 文件中,如果这些 py 文件需要查找某些二进制文件,就会在打包根目录查找,而不去 libs 文件夹查找,因此需要改动一下,让所有依赖的 py 文件也被复制到 libs 文件夹中。

这是整个魔改部分,将它放到 hello.spec 的 a 之后即可,你可以试着理解一下注释。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/771828.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Taurus .Net Core 微服务开源框架:Admin 插件【4-3】 - 配置管理-Mvc【Plugin-MicroService 微服务】

目录 1、系统配置节点:Mvc - Plugin - MicroService 配置界面:注册中心 2、系统配置节点:Mvc - Plugin - MicroService 配置界面:注册中心(从) 3、系统配置节点:Mvc - Plugin - MicroService…

代码随香录day21

235. 二叉搜索树的最近公共祖先 本题思路: 还是要利用二叉搜索树的特性,中序遍历为有序数组。如果pq两个节点都小于root,那么最近公共祖肯定是在他的左子树,如果都大于那么,肯定就在右子树。然后直接return root 代码…

C++编程(四) —— OOP

文章目录 前言一、this指针二、构造和析构三、深拷贝浅拷贝浅拷贝深拷贝 编程实践 前言 什么是OOP思想? OOP语言的四大特征: 抽象,封装/隐藏,继承,多态 一、this指针 this指针》类》很多对象 一套成员方法是如何处…

04.MySQL——用户管理

用户管理 用户管理的价值 用户 用户信息 MySQL中的用户,都存储在系统数据库mysql的user表中 use mysql;select host,user,authentication_string from user;host: 表示这个用户可以从哪个主机登陆,如果是localhost,表示只能从…

【贪心算法Part03】| 1005.K次取反后最大化的数组和、134.加油站、135.分发糖果

目录 🎈LeetCode1005.K次取反后最大化的数组和 🎈LeetCode134.加油站 🎈LeetCode135.分发糖果 🎈LeetCode1005.K次取反后最大化的数组和 链接:1005.K次取反后最大化的数组和 给你一个整数数组 nums 和一个整数 k…

31,list容器

31.1list基本概念 功能:将数据进行链式存储 链表(list)是一种物理存储上非连续的存储结构,数据元素的逻辑顺序是通过链表中的指针链接实现的 链表的组成:链表由一系列结点组成 结点的组成:一个是存储数据元素的数据域&#xf…

【剧前爆米花--web】HTTP协议格式详解以及构造

作者:困了电视剧 专栏:《JavaEE初阶》 文章分布:这是一篇关于HTTP协议的文章,在这篇文章中我会说明HTTP协议格式以及相关的构造,希望对你有所帮助! 目录 HTTP协议 HTTP协议格式 HTTP请求 HTTP响应详情…

拿了 7 个大厂 offer,我有话说

我有一个朋友,举办了一个分享会。他春招期间收割了阿里、京东、美团、拼多多、网易、腾讯云智等多家公司的实习 offer。 他最近从一家A大厂实习换到了另外一家B大厂实习,分享会长达100分钟, 共解答了 40 多个问题。 我也从中抽取一些比较有共…

一个小技巧,分分钟搞定新零售!

新零售模式的兴起带来了线上线下销售渠道的整合,而自动售货机作为新零售模式的一种重要形式,提供了便捷的自助购物体验。 自动售货机作为新零售模式的一种典型应用,以其便利性、快捷性和24小时无人值守的特点,深受消费者和商家的青…

MySQL数据库 【增删改查】

目录 一、新增 指定列插入 一次插入多个数据 二、查询 1、全列查询 2、指定列查询 3、查询字段为表达式 4、查询的时候给列名/表达式 指定别名 5、查询时去重 6、排序查询 7、条件查询 8、模糊查询 9、空值查询 10、分页查询 三、修改 四、删除 SQL 最核心…

python如何知道你的导包在哪/site-package在哪/anaconda中的模块文件在哪

参考: https://stackoverflow.com/questions/31003994/where-is-site-packages-located-in-a-conda-environment anaconda虚拟环境中的site-package在如下目录,/opt/conda/envs/env_cp37_STAGATE_TF/lib/python3.7/site-packages/。 基于寻找你导包的物理位置在哪…

婚纱照主题定义

文章目录 前言关于我们听我们说关于风格:1、主纱(内)2、工笔画(内)3、个性潮拍 (内)4、森系(外)5、园林(外)写在最后 前言 非常感谢在今生有约婚…

doris恢复库恢复表

今天眼疾手快 不小心删了公司生产环境的表 而且碰巧这个数据没有备份的 当时哥们就呆住 还好doris升级过1.2 刚推出了恢复数据的功能~~~~~这里给老天爷磕一个了~~~~~~ 数据删除恢复 Doris为了避免误操作造成的灾难,支持对误删除的数据库/表/分区进行数据恢复&…

什么是DIN连接器 DIN连接器的应用

一、什么是DIN连接器 DIN连接器是一种遵循德国国家标准化组织制定的连接器标准的电子连接器。它采用圆形外观和标准化的接口设计,以确保与其他符合DIN标准的设备和连接器的兼容性。DIN连接器通常由插头和插座两部分组成,通过插拔操作实现电路的连接和断开…

面试时被问到职业规划,怎样回答才最加分?

很多人被问到「职业规划」这个问题的时候,都会很………纠结: 表现得太踏实苦干了,可能会让人觉得没有什么进取心。 职业目标描述得太明确,又会被质疑太在意外部激励而缺乏内部动机。 感觉怎么说都会错,说多一句都是…

Java 中 synchronized 的优化操作:锁升级、锁消除、锁粗化

由 并发编程中常见的锁策略 总结可知,synchronized 具有以下几个特性: 开始时是乐观锁,如果锁冲突频繁,就转换为悲观锁。开始是轻量级锁实现,如果锁被持有的时间较长,就转换成重量级锁。实现轻量级锁时&am…

预处理详解(二)---#define 定义宏 + 宏的使用 + 宏和函数的区别

文章目录 #define 定义标识符#define 定义宏#define 的替换规则带副作用的宏参数宏和函数的区别#undef 的作用冷门知识点:#与## #define 定义标识符 #define定义标识符的格式如下: #define MAX 100 #define reg register//懒人觉得register太长了这些被…

Virus Total 曝数据泄露大事件:涉及多国情报部门

The Hacker News 网站披露,可疑文件和病毒在线检测平台 VirusTotal 曝出数据泄露事故,一名员工无意中将部分 VirusTotal 注册客户的姓名、电子邮件地址等敏感数据信息上传到了恶意软件扫描平台,此举导致约 5600 名用户数据泄露。 据悉&#x…

Display

Pipeline Dataloader和后面网络训练是解耦的,Dataloader负责把数据读出来变成tensor,网络(继承nn.Module父类)负责把这tensor算成最后的输出。在网络传播的过程中,hook记录保留中间数据,用于display作图。…