Python常用的模块非常多,主要分为内置模块和第三方模块两大类,且不同模块应用场景不同又可以分为文本类、数据结构类、数学运算类、文件系统类、爬虫类、网络通讯类等多个类型。
大家常用的内置模块比如:math、re、datetime、urllib、os、random等,第三方模块比如pandas、numpy、requests、matplotlib等。
什么是Python模块?
模块是将复杂的、同一应用领域的功能代码进行封装,你只需要调用接口,输入相应参数,便可以轻松拿到结果,类似瑞士军刀、万能工具箱。
常用内置模块,约200多个
内置模块,顾名思义就是Python软件内嵌的模块,无需额外安装。
想要了解详细的内置模块,最好去Python官网看,挺详细的
https://docs.python.org/zh-cn/3/library/index.html
你也可以在代码行输入print(help(modules))
,会显示全部的内置模块
这里举几个常用的内置模块,并附上代码:
「math 模块」
用来进行数学计算,它提供了很多数学方面的专业函数,适合科研、算法
import math
# 计算平方根
sqrt_value = math.sqrt(25)
print("Square Root:", sqrt_value)
# 计算正弦值
sin_value = math.sin(math.radians(30))
print("Sine Value:", sin_value)
「re 模块」
正则表达式在Python中的扩展实现,该模块能支持正则表达式几乎所有语法,对于文本处理来说必不可少
import re
# 查找匹配的字符串
pattern = r"\d+"
text = "There are 123 apples and 456 oranges."
matches = re.findall(pattern, text)
print("Matches:", matches)
「datetime 模块」
用于处理日期和时间,这个模块非常实用!!!
import datetime
# 获取当前日期和时间
current_datetime = datetime.datetime.now()
print("Current Date and Time:", current_datetime)
# 格式化日期时间
formatted_datetime = current_datetime.strftime("%Y-%m-%d %H:%M:%S")
print("Formatted Date and Time:", formatted_datetime)
「urllib 模块」
用于进行网络请求,获取网页HTML,所谓的爬虫就是这个模块
import urllib.request
# 发起HTTP GET请求
response = urllib.request.urlopen("https://www.example.com")
html = response.read()
print("HTML Content:", html[:100])
「os 模块」
提供了与操作系统交互的功能,比如文件和目录操作
import os
# 获取当前工作目录
current_dir = os.getcwd()
print("Current Directory:", current_dir)
# 列出目录中的文件和子目录
files_and_dirs = os.listdir(current_dir)
print("Files and Directories:", files_and_dirs)
「random 模块」
用于生成伪随机数
import random
# 生成随机整数
random_integer = random.randint(1, 10)
print("Random Integer:", random_integer)
# 从列表中随机选择元素
random_element = random.choice(["apple", "banana", "cherry"])
print("Random Element:", random_element)
「json 模块」
专门用来处理 JSON 格式数据
import json
# 将字典转换为 JSON 格式的字符串
data = {"name": "Alice", "age": 25}
json_string = json.dumps(data)
print("JSON String:", json_string)
# 将 JSON 格式的字符串转换为字典
parsed_data = json.loads(json_string)
print("Parsed Data:", parsed_data)
「collections 模块」
提供了一些除list、dict之外有用的数据容器,比如 defaultdict、Counter 等
from collections import defaultdict, Counter
# 创建默认字典
word_counts = defaultdict(int)
words = ["apple", "banana", "apple", "cherry", "banana", "apple"]
for word in words:
word_counts[word] += 1
print("Word Counts:", word_counts)
# 统计元素出现的次数
element_counts = Counter(words)
print("Element Counts:", element_counts)
「csv 模块」
专门用于处理逗号分隔值(CSV)文件
import re
# 查找匹配的字符串
pattern = r"\d+"
text = "There are 123 apples and 456 oranges."
matches = re.findall(pattern, text)
print("Matches:", matches)
「sys 模块」
提供了与Python解释器交互的功能,例如访问命令行参数
import sys
# 获取命令行参数
arguments = sys.argv
print("Command-line Arguments:", arguments)
常用的第三方模块,十几万个
Python之所以这么受欢迎,很大一部分原因得益于强大的第三方工具生态,几乎各个领域都有对应的模块可以使用。
比如
-
数据科学领域:pandas、numpy、scipy、sympy
-
可视化领域:matplotlib、seaborn、plotly、bokeh、pyecharts
-
机器学习领域:scikit-learn、keras、Tensorflow
-
大数据领域:pyspark、pyflink
-
爬虫领域:requests、scrapy、bs4
-
金融量化领域:ta-lib、zipline、pyfolio
其他各领域都有相应的模块可以使用,这里就不一一列举