Python基础语法篇(下)+ 数据可视化

news2024/9/23 9:35:07

Python基础语法(下)+ 数据可视化

  • 一、函数
    • (一)函数的定义
    • (二)函数的调用和传参
  • 二、文件操作
    • (一)文件读取和写入
    • (二)文件对象及方法
    • (三)实例
  • 三、模块的安装与导入
    • (一)pip包管理
      • (1)库的安装
      • (2)库的导入
    • (二)几个常用库的常用操作
      • (1)数值计算库Numpy
      • (2)绘图库Matplotlib
      • (3)表格库Pandas
  • 四、实战项目
    • (一)使用二分法求解超越方程 ex = pi 的解
    • (二)曲线拟合(数学建模)

一、函数

(一)函数的定义

  • 函数代码块以 def 关键词开头后接函数标识符名称和圆括号()
  • 任何传入参数和自变量必须放在圆括号中间,圆括号之间可以用于定
    义参数。
  • 函数的第一行语句可以选择性地使用文档字符串——用于存放函数说明
  • 函数内容以冒号:起始,并且缩进,return [表达式] 结束函数,选择性地返回一个值给调用方,不带表达式的 return 相当于返回 None.

在这里插入图片描述

(二)函数的调用和传参

def multiply(b,a=2): # 缺省值
	return a * b

print(multiply(1))


def isprime(num):
	"""
	判断是否为质数
	:param num:
	:return:
	"""
	for i in range(2,num):
		if num % i == 0:
			return False
	return True

print(isprime(6))
print(isprime(13))

在这里插入图片描述


二、文件操作

(一)文件读取和写入

打开一个文件

  • Python open() 方法用于打开一个文件,并返回文件对象
  • 在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError
  • 注: 使用 open()方法一定要保证关闭文件对象,即调用 close() 方法。
  • open()函数常用形式是接收两个参数:文件名(file)和模式(mode)

在这里插入图片描述

(二)文件对象及方法

file 对象使用open函数来创建
在这里插入图片描述

(三)实例

(1)注:

  • utf-8 编码方式将中英文编码进行了统一,如果不加且file_sample中有中文,会编码失败
  • 为了防止忘记手动关文件,用 with as:程序结束后,文件就自动释放掉了
## 1、文件的读取
# 法一:
file_sample = open(file="sample.txt",mode="r",encoding="utf-8")
content = file_sample.readlines()
for line in content:
	print(content) # 不加循环,读出来是一行列表
file_sample.close()
# 法二:为了防止忘记手动关文件
with open(file="sample.txt",mode="r",encoding="utf-8") as file_sample:
	content = file_sample.readlines()
	for line in content:
		print(content)

## 2、文件的写入
with open(file = "sample.txt",mode="w",encoding="ulf-8") as file_sample:
	file_sample.write("大家好!")

(2)将100以内的质数都存到一个文件夹中,每行只能写10个数字

def isprime(num):
	for i in range(2, num):
		if num % i == 0:
			return False
	return True

with open(file="prime.txt",mode="w") as file:
	count = 0
	for num in range(2,100):
		if isprime(num):
			print(num)
			count += 1
			file.write(str(num) + ", ") # TypeError: write() argument must be str, not int
			if count % 10 == 0:
				file.write("\n")

在这里插入图片描述


三、模块的安装与导入

(一)pip包管理

(1)库的安装

通过 pip 来安装库
pip 是 Python 包管理工具,该工具提供了对 Python 包的查找、下载、安装、卸载的功能。

指令含义
pip --version查看当前pip的版本
pip install + 包名安装包
pip uninstall + 包名卸载包
pip list查看已经安装了哪些库

在这里插入图片描述

(2)库的导入

## 法一:
import numpy as np
a = 1
b = 2
print(np.add(a,b)) 
## 法二:
from numpy import add
a = 1
b = 2
print(add(a,b)) 

(二)几个常用库的常用操作

(1)数值计算库Numpy

指令:pip install numpy
在这里插入图片描述

import numpy as np
  1. 数组的创建(列表转为数组)
arr = np.array([1,2,3,4,5]) # 列表转为数组
print(arr)
print(type(arr)) # numpy.ndarray --> N-dimensional array

arr = np.array([[1,2,3],[2,3,4],[3,4,5],[4,5,6]])
print(arr)
print(type(arr)) # numpy.ndarray
print("数组形状",arr.shape) # (4, 3)四行三列

在这里插入图片描述

辨析:

(一). 后区分:
1、(numpy.ndarray).属性(Property、Field)/.内部变量(Variable)
2、(numpy.ndarray).函数() (Method、Function)
(二)函数(Function)和方法(Method)的区别:
与类和实例 无 绑定关系的function都属于 函数(function);
与类和实例 有 绑定关系的function都属于 方法(method)。

  1. 索引和切片
arr = np.array([[1,2,3],[2,3,4],[3,4,5],[4,5,6]])
print(arr[0])
print(arr[0:3])
print(arr[1][2])

在这里插入图片描述

  1. 基本运算+ - * / 对应位置上的元素进行 加减乘除
print([1,2,3]+[4,5,6]) # 相当于列表拼接
print(np.array([1,2,3]) + np.array([4,5,6])) # 相当于向量相加
print(np.array([1,2,3]) * np.array([4,5,6]))

在这里插入图片描述

  1. 数组形状操作
arr = np.array([[1,2,3],[2,7,4],[99,4,5],[14,15,6]])
print(arr.shape)
new_arr = arr.reshape(2,6)
print(new_arr,"\n新数组的形状是",new_arr.shape)
new_arr_T = new_arr.transpose() # 转置
print(new_arr_T,"\n新数组转置后的形状是",new_arr_T.shape)

在这里插入图片描述

  1. 进阶使用(线性代数、统计学)

另:快捷键 ctrl+D 快速复制此行内容到下一行

arr = np.array([[1,2,3],[2,7,4],[99,4,5],[14,15,6]])
arr1 = np.array([1,2,3])
arr2 = np.array([4,5,6])
arr1_dot_arr2 = np.dot(arr1,arr2) # 数组的点乘
print(arr1_dot_arr2)
print("数组的平均值",arr.mean()) # 写法一:对象内部函数的使用 
print("数组的平均值",np.mean(arr)) # 写法二:将对象作为参数传入
print("数组的最大值",arr.max())
print("数组的最小值",arr.min()) 
print("数组的标准差",arr.std())
print("数组的和",arr.sum())
print("数组的排序\n",np.sort(arr)) # sort 是 numpy的内部函数,不是 nd数组的内部函数
print("数组的排序\n",np.sort(arr.reshape(-1))) # -1 变成一行
# 筛选
print(arr > 10)
print(arr[arr > 10]) # 通过True、False数组筛选
print(arr[(arr > 5) & (arr < 10)]) # 不能用 and (前后都只有一个量才适用),前后多个量用 & (每一位上做 and 判断)
print(arr[(arr > 5) | (arr < 10)]) # | 按位或 等效于在每一位上进行 or

在这里插入图片描述

注:
1、and、or 只适用于 前后都只有一个量 的情况
2、 & 按位与 等效于在 每一位上进行 and
3、 | 按位或 等效于在 每一位上进行 or
4、sort 是 numpy的内部函数,不是 nd数组的内部函数,只能np.sort(arr),不能 arr.sort()

  1. 数据的保存与导入.npy
arr = np.array([[1,2,3],[2,7,4],[99,4,5],[14,15,6]])
np.save("arr",arr)

在这里插入图片描述

arr = np.load("arr.npy")
print(arr)

在这里插入图片描述

练习
用numpy创建一个4x4的随机数组,只保留10以内的数,并计算出所以元素的和

import numpy as np
np.random.seed(1) # 固定随机数(想让每次随机结果可复现)
print(np.random.rand()) # rand()返回0~1的随机浮点数
arr = np.random.randint(0,100,16).reshape(4,4) # randint(m,n,k)返回m~n的随机整数k个
print(arr)
print(arr[arr <= 10])
print(np.sum(arr[arr <= 10]))

在这里插入图片描述

(2)绘图库Matplotlib

指令:pip install matplotlib
参考网站:matplotlib.org(包含 图+示例代码
在这里插入图片描述

import matplotlib.pyplot as plt # 只用到了绘图操作
import numpy as np # 数值操作需要用到
  1. 参数设置(直接复制在绘图语句最前面即可)
# plt默认的设置里面没有中文字体,中文显示不出来 --> 设置字体
from matplotlib.pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']
# 减号和中文的折线又冲突了 --> 再改一下参数
mpl.rcParams['axes.unicode_minus'] = False
  1. 多个函数绘制到一个图中
# 模拟数据点
x = np.linspace(0,10,10) # 0~10取10个浮点数(10等分)
y = np.sin(x)

# 模拟通过数据点建模,找方程,求拟合参数 --> 平滑的拟合图像
x2 = np.linspace(0,10,100) # 0~10取100个浮点数(100等分)
y2 = np.sin(x2)

plt.xlabel("x")
plt.ylabel("y")

# 绘制到一个图中
plt.scatter(x,y,marker='*',c='r',label="数据点") # marker 点的样式
plt.plot(x2,y2,linestyle='--',label="拟合结果")
plt.legend() # 对各种图标进行标注,加此语句标签(label)才可显示出来
plt.show()

在这里插入图片描述

  1. 一个图中绘制多个函数
# fig(figure --> 整个窗口)、axes:列表(一套axis坐标轴 --> 子图)
# subplots()生成了窗口的句柄(智能指针),要通过句柄内的操作绘图
fig,axes = plt.subplots(1,2) 
axes[0].scatter(x,y,marker='*',c='r',label="数据点")
axes[0].set_xlabel("x1") # 子图和图相关参数的设置函数不同
axes[0].set_ylabel("y")
axes[0].set_title("数据点")
axes[1].plot(x2,y2,linestyle='--',label="拟合效果")
axes[1].set_xlabel("x2")
axes[1].set_title("拟合结果")
fig.legend()
fig.show()

在这里插入图片描述
4. 直方图

x = [1,2,3]
y = [2,4,10]
plt.bar(x,y)
plt.show()

在这里插入图片描述

(3)表格库Pandas

指令:pip install pandas
在这里插入图片描述

import pandas as pd

以鸢尾花的数据为例:
在这里插入图片描述

  1. Python 中 Excel 的创建

pandas中的 DataFrame 数据类型 == pandas 提供的 excel表

data = {'样本号':[1,2,3],'萼片长(cm)':[8.9,2.1,4.5],'类型_num':[0,0,1]}
datadf = pd.DataFrame(data)
print(datadf)

在这里插入图片描述

  1. 读取Excel
    openpyxl 为读取excel用的引擎,要先安装这个库
    在这里插入图片描述
# 读取EXCEL函数
df = pd.read_excel("鸢尾花训练数据.xlsl",sheet_name="sheet1",engine="openpyxl")
print(type(df)) # <class 'pandas.core.frame.DataFrame'>
  1. 数据清洗(预处理)
  • 拿基础信息
    数据量非常大,用 Excel 打不开时,这一步很关键
print(df.head(5)) # df.head(n) 提取表格的前 n 行信息
print(df.info())  # 提取表格基本信息

在这里插入图片描述

  • 缺失值的处理
print(df.head(10))
df = df.dropna() # 丢掉缺失值
print(df.head(10))

print(df.info())
df['类型_num'] = df['类型_num'].astype(float) # 更改数据类型
print(df.info())

变化1:
在这里插入图片描述
在这里插入图片描述

变化2
在这里插入图片描述
在这里插入图片描述

  • 数据的选择和过滤
# <<<< 一种类的筛选 >>>>
# df['类型_num'] 提取列,df['类型_num'] == 1 返回真假
df_1 = df[df['类型_num'] == 1] 
print(df_1.head())
print(df_1.info())

# <<<< 3σ 筛选 >>>>
lb = df['花瓣宽(cm)'].mean() - 3 * df['花瓣宽(cm)'].std() # lower bound 下界
ub = df['花瓣宽(cm)'].mean() + 3 * df['花瓣宽(cm)'].std() # upper bound 上界
selected_df = df[(df['花瓣宽(cm)'] >= lb) & (df['花瓣宽(cm)'] <= ub)]
print(selected_df.info())

练习
自己创建一个dataframe,包含:姓名、身高、体重、成绩。输出第一名的学生,计算平均分并输出低于60分的同学的名字

import numpy as np
import pandas as pd

data = {'姓名':["张三","李四","王五","老六","赵七"],
        '身高':[175 for i in range(5)], # 175 重复5次
        '体重':[50 for i in range(5)],
        '成绩':list(np.random.randint(40,90,5))}
df = pd.DataFrame(data)
print(df)

print("本班最高分同学的信息\n",df[df['成绩'] == max(df['成绩'])])
print("本班的平均分是",np.mean(df['成绩']))
new_df = df[df['成绩'] < 60]
print("本班这次考试不及格的同学有\n",new_df['姓名']) # 只想取姓名出来

在这里插入图片描述


四、实战项目

(一)使用二分法求解超越方程 ex = pi 的解

import numpy as np

def f(x):
    # f(x) = e^x - pi
    return np.e ** x - np.pi

# f(x0) == 0 很难实现 --> 一般写成:np.abs(f(x0) - 0) <= resolution
resolution = 0.0001
def search_x(x1,x2):
    x0 = (x1 + x2) / 2
    if np.abs(f(x0) - 0) <= resolution:
        print("二分法找到的解", x0)
    # 解在(x1,x0)
    elif f(x1) * f(x0) < 0:
        search_x(x1,x0)
        pass # 仅作占位符,不做任何操作
    # 解在(x0,x2)
    elif f(x0) * f(x2) < 0:
        search_x(x0,x2)
        pass

print("方程的根",np.log(np.pi))
search_x(0,10)

在这里插入图片描述

(二)曲线拟合(数学建模)

一个成年人饮酒后血液中的酒精含量虽时间变化是:
时间(h) :[0.25,0.5,0.75,1,1.5,2,2.5,3,3.5,4,4.5,5,6,7,8,9,10,11,12,13,14,15,16]
酒精含量(mg/100ml) :[30,68,75,82,82,77,68,68,58,51,50,41,38,35,28,25,18,15,12,10,7,7,4]

import matplotlib.pyplot as plt
import numpy as np
from numpy import polyfit # polyfit多项式拟合

time = [0.25,0.5,0.75,1,1.5,2,2.5,3,3.5,4,4.5,5,6,7,8,9,10,11,12,13,14,15,16]
alcohol = [30,68,75,82,82,77,68,68,58,51,50,41,38,35,28,25,18,15,12,10,7,7,4]
y = [np.log(a) for a in alcohol]  # 计算机中的log以e为底
# 在进行数据分析和拟合时,有时候原始数据并不适合直接进行线性拟合,因为它们的分布可能不是线性的。
# 通过取对数变换,可以将非线性关系转换为线性关系,从而更容易进行线性拟合。
# 具体到这段代码中,alcohol 列表中的数据可能呈现出指数衰减的趋势。
# 通过取对数变换,可以将这种指数关系转换为线性关系,从而可以使用线性回归(多项式拟合)来拟合数据。

alcohol_tup = alcohol[alcohol.index(max(alcohol)):] # 从最高点开始,到末尾(截断)
time_tup = time[alcohol.index(max(alcohol)):]
y_tup = y[alcohol.index(max(alcohol)):]

k,b = polyfit(time_tup,y_tup,deg=1) # degree:多项式拟合最高项的次数
print(k,b)  # 和 print(polyfit(time_tup,y_tup,deg=1)) 输出结果相同
# y = kx + b --> [-0.16961681  4.51817704]前后两个值分别为 k 和 b

def model(t):
    a = np.e ** (k * t + b)
    return a

time0 = np.linspace(time_tup[0],16,1000)
predy = model(time0)

plt.scatter(time,alcohol,label="sample point")
plt.plot(time0,predy,c='r',label="fitting results")
plt.title("alcohol change with time")
plt.ylabel("alcohol [mg/100ml]")
plt.xlabel("time [h]")
plt.legend()
plt.show()

思路在这里插入图片描述
在这里插入图片描述
拟合后结果图
在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1934114.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

探寻大模型回答9.9和9.11犯错的根本原因

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

WinOS下获取dll中的方法列表

开发的Windows应用程序的安装环境从Win11 23H2切换到24H2时&#xff0c;出现获取电源模式不正确的问题&#xff0c;通过debug代码发现获取电源模式的方法是走的方法编号。由于Win11 24H2中增加了对外提供的方法&#xff0c;而增加的方法放在方法列表中间&#xff0c;导致其后面…

生成式AI的未来:对话的艺术与代理的实践

生成式 AI 的发展方向&#xff0c;是 Chat 还是 Agent&#xff1f; 随着生成式AI技术的不断进步&#xff0c;关于其未来发展方向的讨论也愈发激烈。究竟生成式AI的未来是在对话系统&#xff08;Chat&#xff09;中展现智慧&#xff0c;还是在自主代理&#xff08;Agent&#x…

图片太大怎么压缩变小?交给这4个方法就能行

在钱塘江畔&#xff0c;一场罕见的“蝴蝶潮”翩然而至&#xff0c;不仅带来了自然奇观&#xff0c;也预示着好运的降临。然而&#xff0c;当我们将这份美好瞬间分享给更多人时&#xff0c;却遇到了一个小小难题——高分辨率的照片占据了大量的存储空间&#xff0c;上传至社交平…

访问控制系列

目录 一、基本概念 1.客体与主体 2.引用监控器与引用验证机制 3.安全策略与安全模型 4.安全内核 5.可信计算基 二、访问矩阵 三、访问控制策略 1.主体属性 2.客体属性 3.授权者组成 4.访问控制粒度 5.主体、客体状态 6.历史记录和上下文环境 7.数据内容 8.决策…

推荐3款堪称神器的工具软件,实用强大颜值高,你不能错过

Flameshot Flameshot是一款功能强大且易于使用的开源屏幕截图软件&#xff0c;广泛应用于Linux、Windows和macOS等平台。它不仅支持图形界面&#xff08;GUI&#xff09;操作&#xff0c;还提供命令行接口&#xff08;CLI&#xff09;&#xff0c;使得用户可以根据自己的需求选…

SPINDILOMETER:用于多导睡眠图的睡眠纺锤波模型

摘要 通过对近年来睡眠脑电(EEG)信号分析方法的研究&#xff0c;本文提出了一种可集成到多导睡眠图(PSG)设备中的SPINDILOMETER模型&#xff0c;以供PSG电生理信号研究人员、临床睡眠医生和技术人员使用。为此&#xff0c;通过分析PSG中的脑电信号&#xff0c;开发了一个测量睡…

Qt界面假死原因

创建一个播放器类&#xff0c;继承QLabel&#xff0c;在播放器类中起一个线程用ffmpeg取流解码&#xff0c;将解码后的图像保存到队列&#xff0c;在gui线程中调用update()刷新显示。 当ffmpeg打开视频流失败后调用update()将qlabel刷新为黑色&#xff0c;有一定概率会使得qla…

【踩坑日记】【教程】嵌入式 Linux 通过 nfs 下载出现 T T T T [Retry count exceeded: starting again]

文章目录 1 本篇文章解决的问题2 问题解决原理3 问题环境4 开启 ubuntu-20.04 的 nfs24.1 确认 nfs2 是否已经开启4.2 开启 nfs2 5 卸载 iptables5.1 卸载 iptables5.2 禁用 ufw5.3 尝试重新下载 6 原理分析6.1 nfs2 开启部分6.2 卸载 iptables 部分 7 后记7.1 拓扑结构一7.2 拓…

2024辽宁省数学建模B题【钢铁产品质量优化】原创论文分享

大家好呀&#xff0c;从发布赛题一直到现在&#xff0c;总算完成了2024 年辽宁省大学数学建模竞赛B题钢铁产品质量优化完整的成品论文。 本论文可以保证原创&#xff0c;保证高质量。绝不是随便引用一大堆模型和代码复制粘贴进来完全没有应用糊弄人的垃圾半成品论文。 B题论文…

C++ 几何计算库

代码 #include <iostream> #include <list> #include <CGAL/Simple_cartesian.h> #include <CGAL/AABB_tree.h> #include <CGAL/AABB_traits.h> #include <CGAL/AABB_segment_primitive.h> #include <CGAL/Polygon_2.h>typedef CGAL…

数学建模(1)

论文&#xff1a;做流程图 论文查重不能高于30% 论文 分模块备战 摘要不能超过一页的四分之三 数学建模的六个步骤: 【写作】---学术语言 团队练题

【hadoop大数据集群 2】

【hadoop大数据集群 2】 文章目录 【hadoop大数据集群 2】1. 虚拟机克隆2. 时间同步3. 环境变量配置、启动集群、关闭集群 1. 虚拟机克隆 克隆之后一定要重新生成新虚拟机唯一的MAC地址和UUID等&#xff0c;确保新虚拟机与源虚拟机在网络拓扑中不发生冲突。 注意1.生成新的MA…

新华三H3CNE网络工程师认证—VLAN使用场景与原理

通过华三的技术原理与VLAN配置来学习&#xff0c;首先介绍VLAN&#xff0c;然后介绍VLAN的基本原理&#xff0c;最后介绍VLAN的基本配置。 一、传统以太网问题 在传统网络中&#xff0c;交换机的数量足够多就会出现问题&#xff0c;广播域变得很大&#xff0c;分割广播域需要…

借力Jersey,铸就卓越RESTful API体验

目录 maven 创建 jersey 项目 运行 支持返回 json 数据对象 1. 引言 在当今数字化时代&#xff0c;API&#xff08;应用程序编程接口&#xff09;已成为连接不同软件系统和服务的桥梁。RESTful API以其简洁、轻量级和易于理解的特点&#xff0c;成为了API设计的首选标准。本…

甲骨文面试题【动态规划】力扣377.组合总和IV

给你一个由 不同 整数组成的数组 nums &#xff0c;和一个目标整数 target 。请你从 nums 中找出并返回总和为 target 的元素组合的个数。 题目数据保证答案符合 32 位整数范围。 示例 1&#xff1a; 输入&#xff1a;nums [1,2,3], target 4 输出&#xff1a;7 解释&#x…

C语言:键盘录入案例

主要使用了scanf&#xff1b; scanf的使用方法和注意事项&#xff1a; 1.作用&#xff1a; 用于接收键盘输入的数据并赋值给对应的变量 2.使用方式; scanf("占位符",&变量名); 3.注意事项; 占位符后面的的变量要对应 第一个参数中不写换行 案例1&#xf…

夏令营入门组day5

目录 一. 城市距离 二. 史莱姆 一. 城市距离 &#xff08;1&#xff09;思路 每次询问&#xff0c;对于每一个点都判断与下一个点是否为临近点会超时&#xff0c;因此预处理&#xff0c;预先判断每一个点的临近点&#xff0c;然后将花费存入前缀和数组&#xff0c;这样在每次询…

GraphRAG:一种新型的RAG技术

微软前几天发布的 GraphRAG 架构非常厉害&#xff0c;但是具体的原理和内容可能不太好理解。Neo4j 的 CTO 写了一篇详细的文章《GraphRAG 宣言&#xff1a;为 GenAI 增加知识》&#xff0c;通俗易懂的介绍了 GraphRAG 的原理、与传统 RAG 的区别、GraphRAG的优势、知识图谱的创…

lua 游戏架构 之 LoaderWallet 异步加载

定义了一个名为LoaderWallet class&#xff0c;用于管理资源加载器&#xff08;Loader&#xff09;。这个类封装了资源加载的功能&#xff0c;包括异步加载&#xff0c;以及资源的释放和状态查询。下面是对代码的详细解释&#xff1a; ### 类定义和初始化 这里定义了一个名为…