python进阶(28)import导入机制原理

news2024/10/6 12:20:41

前言

在Python中,一个.py文件代表一个Module。在Module中可以是任何的符合Python文件格式的Python脚本。了解Module导入机制大有用处。

1. Module组成

一个.py文件就是一个module。Module中包括attribute, function等。 这里说的attribute其实是module的global variable。
我们创建1个test1.py文件,代码如下

# 定义1个全局变量a
a = 1
# 声明一个全局变量moduleName
global moduleName


# 定义一个函数printModuleName
def printModuleName():
    print(a + 2)
    print(__name__)
    print(moduleName)

print(dir())

这里我们定义了3个全局变量amoduleNameprintModuleName,除了我们自己定义的以外还有module内置的全局变量

1.1 Module 内置全局变量

上面我们说到了,每一个模块都有内置的全局变量,我们可以使用dir()函数,用于查看模块内容,例如上面的例子中,使用dir()查看结果如下:

['__annotations__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'a', 'moduleName', 'printModuleName']

其中a, moduleName, printModuleName 是由用户自定义的。其他的全是内置的。下面介绍几个常用的内置全局变量

1.1.1 __name__

指的是当前模块的名称,比如上面的test1.py,模块的名称默认就是test1,如果一个module是程序的入口,那么__name__=__'main'__,这也是我们经常看到用到的

1.1.2 __builtins__

它就是内置模块builtins的引用。可以通过如下代码测试:

import builtins
print(builtins == __builtins__)

打印结果为True,在Python代码里,不需要我们导入就能直接使用的函数、类等,都是在这个内置模块里的。例如:rangedir

1.1.3 __doc__

它就是module的文档说明,具体是文件头之后、代码(包含import)之前的第一个多行注释,测试如下

点击查看代码
"""
模块导入机制测试
"""


import builtins


# 定义1个全局变量a
a = 1
# 声明一个全局变量moduleName
global moduleName


# 定义一个函数printModuleName
def printModuleName():
    print(a + 2)
    print(__name__)
    print(moduleName)


print(__doc__)

最后打印结果为

模块导入机制测试

当然如果你想查看某个方法的说明,也可以这么使用

1.1.4 __file__

当前module所在的文件的绝对路径

1.1.5 __package__

当前module所在的包名。如果没有,为None。

2. 包package

  为避免模块名冲突,Python引入了按目录组织模块的方法,称之为包(package)。包是含有Python模块的文件夹。

  当一个文件夹下有init.py时,意为该文件夹是一个包(package),其下的多个模块(module)构成一个整体,而这些模块(module)都可通过同一个包(package)导入其他代码中。

  其中init.py文件用于组织包(package),方便管理各个模块之间的引用、控制着包的导入行为。

  该文件可以什么内容都不写,即为空文件,存在即可,相当于一个标记。

  但若想使用from pacakge_1 import *这种形式的写法,需在init.py中加上:__all__ = ['file_a', 'file_b'] ,并且package_1下有file_a.pyfile_b.py,在导入时init.py文件将被执行。

  但不建议在init.py中写模块,以保证该文件简单。不过可在init.py导入我们需要的模块,以便避免一个个导入、方便使用。

  其中,__all__是一个重要的变量,用来指定此包(package)被import *时,哪些模块(module)会被import进【当前作用域中】。不在__all__列表中的模块不会被其他程序引用。可以重写__all__,如__all__= ['当前所属包模块1名字', '模块1名字'],如果写了这个,则会按列表中的模块名进行导入

  在模糊导入时,形如from package import *,*是由__all__定义的。

  当我们在导入一个包(package)时(会先加载__init__.py定义的引入模块,然后再运行其他代码),实际上是导入的它的__init__.py文件(导入时,该文件自动运行,助我们一下导入该包中的多个模块)。我们可以在 init.py中再导入其他的包(package)或模块或自定义类。

2.1 实战案例

首先我们创建3个包,分别是testtest2test3
test包下创建test1.py用来执行测试
test2包下创建file_a.pyfile_b.py,用来测试包的导入
test3包下创建file_c.py,辅助测试
具体结构如下:
核心代码在test2/__init__.py中如下

__all__ = ['file_a', 'file_b', 'file_c', 'test_d']


from test3 import file_c


def test_d():
    return "test_d"

解释下,当我们在test/test1.py中写了from test2 import *这句代码,程序不是直接导入test2下的所有模块,而是导入__init__.py文件并自动运行,由于我们写了__all__ = ['file_a', 'file_b', 'file_c', 'test_d'],file_a和file_b是当下包中的模块,file_c是我们从test3包中导入的,test_d是__init__.py下我们定义的函数。

所以from test2 import *就是把__all__中指定的模块和函数导入进来了,接着我们查看test1.py下的代码

from test2 import *
print(file_a.a())
print(file_b.b())
print(file_c.c())
print(test_d())

如果打印有结果,则证明了导入成功,并且导入的是__all__下的模块和函数

3.sys.modules、命名空间

3.1 sys.modules

sys.modules是一个将模块名称映射到已加载的模块的字典。可用来强制重新加载modules。Python一启动,它将被加载在内存中。

当我们导入新modules,sys.modules将自动记录下该module;当第二次再导入该module时,Python将直接到字典中查找,加快运行速度。

它是1个字典,故拥有字典的一切方法,如sys.modules.keys()sys.modules.values()sys.modules['os']。但请不要轻易替换字典、或从字典中删除某元素,将可能导致Python运行失败。

3.2 命名空间

命名空间就像一个dict,key是变量名字,value是变量的值。

  • 每个函数function都有自己的命名空间,称local namespace,记录函数的变量。
  • 每个模块module都有自己的命名空间,称global namespace,记录模块的变量,包括functions、classes、导入的modules、module级别的变量和常量。
  • build-in命名空间,它包含build-in function和exceptions,可被任意模块访问。

假设你要访问某段Python代码中的变量x时,Python会在所有的命名空间中查找该变量,顺序是:

  1. local namespace 即当前函数或类方法。若找到,则停止搜索;
  2. global namespace 即当前模块。若找到,则停止搜索;
  3. build-in namespace Python会假设变量x是build-in的内置函数或变量。若变量x不是build-in的内置函数或变量,Python将报错NameError。
  4. 对于闭包,若在local namespace找不到该变量,则下一个查找目标是父函数的local namespace。

我们可以看一个小例子

# test_namespace.py
def func(a=1):
    b = 2
    print(locals())  # 打印当前函数的局部命名空间
    '''
    locs = locals()  # 只读,不可写,会报错
    locs['c'] = 3
    print(c)
    '''
    return a + b


func()
glos = globals()
glos['d'] = 4
print(d)
print(globals())

执行func()会打印函数func的局部命名空间,结果如下:

{'a': 1, 'b': 2}

执行print(globals())会打印模块test_namespace的全局命名空间,结果如下:

{'__name__': '__main__', '__doc__': None, '__package__': None, '__loader__': <_frozen_importlib_external.SourceFileLoader object at 0x7fde2605c730>, '__spec__': None, '__annotations__': {}, '__builtins__': <module 'builtins' (built-in)>, '__file__': '/Users/jkc/PycharmProjects/pythonProject1/test_namespace.py', '__cached__': None, 'func': <function func at 0x7fde246b9310>, 'glos': {...}, 'd': 4}

内置函数locals()globals()都会返回一个字典。区别:前者只读、后者可写。

命名空间在from module_name import import module_name中的体现:from关键词是导入模块或包中的某个部分。

  1. from module_A import X:会将该模块的函数/变量导入到当前模块的命名空间中,无须用module_A.X访问了。
  2. import module_A:modules_A本身被导入,但保存它原有的命名空间,故得用module_A.X方式访问其函数或变量。
    接下来我们测试一下:

可以看到我们导入了函数a和模块file_c,接着我们打印了全局变量,结果如下:

{'__name__': '__main__', '__doc__': None, '__package__': None, '__loader__': <_frozen_importlib_external.SourceFileLoader object at 0x7fab9585c730>, '__spec__': None, '__annotations__': {}, '__builtins__': <module 'builtins' (built-in)>, '__file__': '/Users/jkc/PycharmProjects/pythonProject1/test3/test_namespace.py', '__cached__': None, 'a': <function a at 0x7fab95b04040>, 'file_c': <module 'file_c' from '/Users/jkc/PycharmProjects/pythonProject1/test3/file_c.py'>}

可以很清楚的看到全局变量中有函数a和模块file_c,接着我们尝试能否调用者2个

from test2.file_a import a
import file_c


print(globals())


file_c.c()
a()

最后也是可以成功调用

4. 导入

准备工作如下:

4.1 绝对导入

所有的模块import都从“根节点”开始。根节点的位置由sys.path中的路径决定,项目的根目录一般自动在sys.path中。如果希望程序能处处执行,需手动修改sys.path

例1:c.py中导入B包/B1子包/b1.py模块

import os
import sys


BASE_DIR = os.path.dirname(os.path.abspath(__file__))
sys.path.append(BASE_DIR)

# 导入B包中的子包B1中的模块b1
from B.B1 import b1

例2:b1.py中导入b2.py模块

# 从B包中的子包B1中导入模块b2
from B.B1 import b2

4.2 相对导入

只关心相对自己当前目录的模块位置就好。不能在包(package)的内部直接执行(会报错)。不管根节点在哪儿,包内的模块相对位置都是正确的。

b1.py代码如下:

# from . import b2  # 这种导入方式会报错
import b2  # 正确
b2.print_b2()

b2.py代码如下:

def print_b2():
    print('b2')

最后运行b1.py,打印b2。

4.3 单独导入包

单独import某个包名称时,不会导入该包中所包含的所有子模块。

c.py导入同级目录B包的子包B1包的b2模块,执行b2模块的print_b2()方法:
c.py代码

import B
B.B1.b2.print_b2()

运行c.py会以下错误

AttributeError: module 'B' has no attribute 'B1'

因为import B并不会自动将B下的子模块导入进去,需要手动添加,解决办法如下
在B/init.py代码下添加如下代码

from . import B1

在B/B1/init.py代码下添加如下代码

from . import b2

此时,执行c.py,成功打印b2。

5. import运行机制

我们要理解Python在执行import语句时,进行了啥操作?
step1:创建一个新的、空的module对象(它可能包含多个module);
step2:将该module对象 插入sys.modules中;
step3:装载module的代码(如果需要,需先编译);
step4:执行新的module中对应的代码。

在执行step3时,首先需找到module程序所在的位置,如导入的module名字为mod_1,则解释器得找到mod_1.py文件,搜索顺序是:
当前路径(或当前目录指定sys.path)->PYTHONPATH->Python安装设置相关的默认路径。

对于不在sys.path中,一定要避免用import导入自定义包(package)的子模块(module),而要用from…import… 的绝对导入或相对导入,且包(package)的相对导入只能用from形式。

5.1 标准import,顶部导入

5.2 嵌套import

5.2.1 顺序导入-import

  1. moduleB定义了变量b=2
  2. moduleA导入模块moduleB,当然moduleB还可以导入其他模块
  3. test模块导入moduleA

最后执行test.py,将打印3

5.2.2 循环导入/嵌套导入

moduleA.py

from moduleB import ClassB


class ClassA:
    pass

moduleB.py

from moduleA import ClassA


class ClassB:
    pass

当执行moduleA.py时会报错

ImportError: cannot import name 'ClassA' from partially initialized module 'moduleA'

报错分析:

  1. 在运行moduleA时,首选会执行from moduleB import ClassB代码
  2. 程序会判断sys.modules中是否有
  3. 有代表字在第一次执行时,创建的 对象已经缓存在 sys.modules,直接得到 ,不过依然是空对象,因为 __dict__找不到ClassB,会报错
  4. 没有会为moduleB.py创建1个module对象 ,此时创建的module对象为空
    4.1 然后执行moduleB.py的第一条语句 from moduleA import ClassA
    PS:这么做的原因是python内部创建了module对象 后立马执行moduleB.py,目的是填充 <module moduleB>__dict__,当然最终未能成功填充
    4.2 接着判断sys.modules中是否有
    4.3 没有会为moduleA.py创建1个module对象
    PS:此时创建的module对象同样为空,则需要执行moduleA.py语句 from moduleB import ClassB
  5. 最后回到操作2的过程,这次判断有module对象,会进行操作3,最后就会报错cannot import name 'ClassA'

解决办法:组织代码(重构代码):更改代码布局,可合并或分离竞争资源。

参考内如如下:Python 3.x | 史上最详解的导入(import)Python Module

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/28289.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[ros2实操]2-ros2的消息和ros1的消息转换

记录一下ros2和ros1消息互传的操作 !!!需要注意的是,只有ros1订阅了相关ros2的消息时,ros1_bridge节点才会转发相关消息. 参考链接 1,docker镜像链接:待定 2,github教程:Bridge communication between ROS 1 and ROS 2 一.准备步骤 为在自己原来的系统ubuntu1804上同时安装…

[附源码]SSM计算机毕业设计基于ssm的电子网上商城JAVA

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

通过五个维度比较分析关键容灾技术

【摘要】每一种容灾技术方案,可以从实现的技术复杂度、需要投入的成本、需要承担的风险、技术的先进性、技术的成熟度等几个方面来综合评估,寻求适合企业的最佳技术组合方案。本文对几类关键容灾技术进行了比较分析。(文中涉及相关技术产品最新参数请以官网最新发布为准) …

【SpringBoot】SpringBoot开启MyBatis缓存+ehcache(一二级缓存和myBatis的差不多,第三方缓存是jar包的不一样)

文章目录第三方缓存1、导jar包2、配置文件ehcache.xml3、EnableCaching开启缓存4、application.yml读取配置文件5、使用缓存&#xff08;注解Cacheable&#xff09;Cacheable的三个属性&#xff1a;value、key和condition▶测试&#xff1a;root对象可以用来生成keyCachePutCac…

LeetCode HOT 100 —— 4.寻找两个正序数组的中位数

题目 给定两个大小分别为 m 和 n 的正序&#xff08;从小到大&#xff09;数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。 算法的时间复杂度应该为 O(log (mn)) 思路 正序数组&#xff0c;立即推—>二分查找 如果本题不要求时间复杂度O&#xff08;log…

光点数据可视化解决方案,助力新型智慧城市打造_光点科技

随着城市化进程的快速发展&#xff0c;智慧城市逐渐从理论理念演变为实践。智慧城市作为一个极其复杂的城市数字化建设和运营系统&#xff0c;涵盖了大量的智能交通、智能物流、智能公园等子系统。对于智慧城市解决方案提供商和集成商来说&#xff0c;其数据可视化产品的统一监…

View的绘制流程

view的绘制流程主要为measure&#xff0c;layout&#xff0c;draw三个阶段 View与window的逻辑结构如图所示&#xff1a; ViewRootImpl&#xff08;替代ViewRoot&#xff09;类&#xff0c;是连接WindowMannager和DecorView的纽带&#xff0c;View的三大流程均是通过ViewRoot完…

godoc安装与go文档查询

前言 最近在用go语言做项目&#xff0c;语法还是很简单的&#xff0c;但是API不熟悉&#xff0c;&#x1f605;&#xff0c;另外也没有类似Java的Spring这样的独秀的IOC和AOP框架&#xff0c;灵活度很大&#xff0c;经常需要查询文档&#xff0c;但是godoc从go1.14.2开始就从内…

【CNN】MobileNet——卷积神经网络中轻量级的经典

前言 MobileNet 系列 是 Andrew G. Howard&#xff08;Google Inc.&#xff09; 等人于 2017 年&#xff08;其实是 2016 年先于 Xception 已经提出&#xff0c;但是直到 2017 年才挂到 arXiv 上&#xff09;在 MobileNets: Efficient Convolutional Neural Networks for Mobi…

干货 | 如何在子查询和联接之间选择

在 联接与子查询&#xff1a;哪个更快&#xff1f;文章我们了解到连接往往比子查询执行得更快。话虽如此&#xff0c;这并不是一条通用准则&#xff0c;因此你可能不希望自动假设联接更可取。正如那篇文章中提到的&#xff0c;如果你需要在查询添加许多联接&#xff0c;数据库服…

分治算法Divide and Conquer

评价 它可以减少运行的时间&#xff0c;很多问题如果暴力求解需要O(n^2)的复杂度&#xff0c;而通过分治可以减少到O&#xff08;nlogn&#xff09; 当与随机化技术相结合时&#xff0c;分治的功能很强大 分治算法的步骤 1.先将大的问题分解为一个个小的子问题 2.对每一个子…

swift内存绑定

swift提供了3种不同的API来绑定/重新绑定指针 assumingMemoryBound(to:)bindMemory(to: capacity:)withMemoryRebound(to: capacity: body:) 绕过编译器检查 - assumingMemoryBound 就是假定内存绑定 func testPointer(_ p: UnsafePointer<Int>) {print(p) } let tup…

Tomcat运行流程、Servlet运行原理以及常用API

文章目录Servlet原理Tomcat 的定位Tomcat 的伪代码Tomcat 初始化流程Tomcat处理请求总结Servlet的核心APIHttpServletHttpServletRequestHttpServletResponseCookie 和 SessionServlet原理 Servlet终究是属于应用层&#xff0c;它是在应用层进行的一系列操作&#xff0c;它的底…

Prometheus Operator 实战 监控 etcd 集群

上节课和大家讲解了 Prometheus Operator 的安装和基本使用方法&#xff0c;这节课给大家介绍如何在 Prometheus Operator 中添加一个自定义的监控项。 除了 Kubernetes 集群中的一些资源对象、节点以及组件需要监控&#xff0c;有的时候我们可能还需要根据实际的业务需求去添…

Java 后端 本地调试-获取微信公众号 openId

Java 后端 本地调试-获取微信公众号 openId申请测试微信公众号内网穿透工具配置公众号获取用户 openId申请测试微信公众号 微信测试公众号 内网穿透工具 netapp 配置公众号 搜索网页账号选项 点击修改&#xff0c;填写内网穿透的域名 获取用户 openId 1 第一步&#xff…

国家高新技术企业的好处

国家高新技术企业的好处&#xff1a;享受税收减免优惠政策&#xff1b;国家科研经费支持和财政拨款&#xff1b;国家级的资质认证硬招牌&#xff1b;提升企业品牌形象&#xff1b;促进企业科技转型&#xff1b;提高企业市场价值&#xff1b;提高企业资本价值&#xff1b;吸引市…

【电脑讲解】电脑如何实现双系统

核心提示&#xff1a;电脑双系统&#xff0c;大家应该不会太陌生&#xff0c;有的网吧就装的是双系统&#xff0c;双系统可以满足不同人群的需要&#xff0c;可以这样说&#xff0c;一个系统可以专门工作使用&#xff0c;另一个可以供玩游戏使用&#xff0c;&#xff08;电脑硬…

[Linux打怪升级之路]-环境变量

前言 作者&#xff1a;小蜗牛向前冲 名言&#xff1a;我可以接受失败&#xff0c;但我不能接受放弃 如果觉的博主的文章还不错的话&#xff0c;还请点赞&#xff0c;收藏&#xff0c;关注&#x1f440;支持博主。如果发现有问题的地方欢迎❀大家在评论区指正。 目录 一、认识环…

一文详解JVM的内存结构

目录 前言 内存结构 程序计数器 虚拟机栈 本地方法栈 堆内存 方法区 内部组成 前言 Java的JVM解决的问题是跨操作系统问题。程序员只需要专注于代码的编写&#xff0c;这些代码能够在不同的操作系统Mac&#xff0c;Linux和Windows运行的前提是JVM。JVM还提供了垃圾回收机制…

Linux终端操作-Xshell和Xftp(家庭版)

目录一&#xff0c;终端操作二&#xff0c;软件安装1&#xff0c;Xshell, Xftp下载2&#xff0c;Xshell安装3&#xff0c;Xftp安装三&#xff0c;使用1&#xff0c;Xshell建立连接2&#xff0c;Xftp上传文件一&#xff0c;终端操作 上一篇博客记录了如何本地安装虚拟机并实现本…