人工智能项目论文复现

news2025/1/7 6:24:16

文章目录

  • (一)技术学习任务
    • Ⅰ、机器学习之聚类
      • 1、基本介绍概念
      • 2、聚类分析基本介绍
      • 3、K均值聚类
      • 4、K近邻分类模型(KNN)
      • 5、均值漂移聚类
      • 6、代码实现
      • 7、上述三种算法总结
    • Ⅱ、机器学习其他常用技术
      • 1、决策树基本知识
      • 2、异常检测概念
      • 3、主成分分析
      • 4、决策树代码实现
      • 5、基于高斯分布的异常检测代码
      • 6、主成分分析代码实现
  • (二)论文复现工作
    • Ⅰ、项目准备运行工作
      • 1、配置项目环境
      • 2、连接4090运行项目
      • 3、进行映射至服务器
    • Ⅱ、复现过程中问题及其解决方案
      • 1、dtensor问题及其解决方案
      • 2、np.object问题及其解决方案
      • 3、protocol问题及其解决方案
      • 4、num_samples 问题及其解决方案
      • 5、torch.cuda.FloatTensor问题及其解决方案
    • Ⅲ、折腾了好久终于开始炼丹
      • 1、训练过程
      • 2、预测过程


在这里插入图片描述
在这里插入图片描述

论文复现跳转链接如下

点击跳转 🚀 ⭐️

在这里插入图片描述


(一)技术学习任务

Ⅰ、机器学习之聚类

1、基本介绍概念

  • 监督学习是利用标记数据进行训练,可以用于分类、回归等任务。
  • 无监督学习则是利用未标记数据进行训练,可以用于聚类、异常检测等任务(没有对与错,寻找数据的共同特点)。
  • 半监督学习则是介于监督学习和无监督学习之间的一种学习方式,利用一小部分已标记数据和大量未标记数据进行训练。
  • 强化学习则是利用智能体与环境的交互进行学习,可以用于处理与环境交互的问题。
  • 无监督学习 是机器学习的一种重要类型,它专注于从未标记或未分类的数据中发现隐藏的模式和结构。与监督学习不同,无监督学习的数据没有显式的标签或已知的结果变量,其核心目的是探索数据的内在结构和关系。

  • 机器学习的二种方法,没有给定事先标记过的训练示例,自动对输入的数据进行分类或分群,
    优点:

    • ①算法不受监督信息(偏见)的约束,可能考虑到新的信息
    • ②不需要标签数据,极大程度扩大数据样本

主要应用:聚类分析、关联规则、维度缩减、聚类分析

无监督学习主要包括以下几种任务:

  1. 聚类:将数据划分为多个群组或簇,使得同一簇内的数据点彼此相似,而不同簇的数据点相异。常见的聚类算法包括K-均值(K-means)、层次聚类(Hierarchical clustering)等。
  2. 降维:减少数据中的变量数量,提取重要特征,同时保留数据的大部分重要信息。降维有助于提高计算效率、降噪和改进数据可视化。常见的降维算法包括主成分分析(PCA)、t-SNE等。
  3. 关联规则学习:在大型数据集中发现变量之间的有意义的关系。这有助于市场篮子分析、交叉销售等应用。
  4. 异常检测:识别数据集中的异常、奇异或不符合预期的数据点。这在欺诈检测、网络安全等领域有重要应用。
  5. 生成模型:学习数据的分布,以生成新的、与训练数据类似的数据。这有助于数据增强、艺术创作等。

2、聚类分析基本介绍


KMeans聚类

①根据数据与中心点距离划分类别
②基于类别数据更新中心点
③重复过程直到收敛

特点:
1、实现简单,收敛快
2、需要指定类别数量
在这里插入图片描述

均值漂移聚类(Meanshift):

①在中心点一定区域裣索薮据点
②更新中心
③重夏流程到中心点稳定

特点:
1、自动发现类别数量,不需要人工选择
2、需要选择区域半径


DBSCAN算法(基于密度的空间聚类算法)

①基于区域点密度筛选有效数据
②基于有效数据向周边扩张,直到没有新点加入

特点:
1、过滤噪音数据
2、不需要人为选择类别数量
3、数据密度不同时影响结果


3、K均值聚类

  • K-均值算法:以空间K个点为中心进行聚类,对最靠近他们的对象归类,是聚类算法中最为基础但也最为重要的算法。

在这里插入图片描述
算法流程
1、选择聚类的个数k
2、确定聚类中心
3、根据点到聚类中心聚类确定各个点所属类别
4、根据各个类别数据更新聚类中心
5、重复以上步骤直到收敛(中心点不再变化)

优点:
1、原理简单,实现容易,收敛速度快
2、参数少,方便使用
缺点:
1、必须设置簇的数量
2、随机选择初始聚类中心,结果可能缺乏一致性

在这里插入图片描述

4、K近邻分类模型(KNN)

  • 给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实例分类到这个类中。

在这里插入图片描述

5、均值漂移聚类

  • 均值漂移算法:一种基于密度梯度上升的聚类算法(沿着密度上升方向寻找聚类中心点)

在这里插入图片描述
算法流程
1、随机选择未分类点作为中心点
2、找出离中心点距离在带宽之丙的点,记做集合S
3、计算从中心点到集合S中每个元素的偏移向量M
4、中心点以向量M移动
5、重复步骤2-4,直到收敛
6、重复1-5直到所有的点都被归类
7、分类:根据每个类,对每个点的访问频率,取访问频率最大的那个类,作为当前点集的所属类

6、代码实现

  • KMeans算法实现聚类
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# KMeans算法实现聚类
from sklearn.cluster import KMeans
from sklearn.metrics import accuracy_score

data = pd.read_csv('data.csv')

x = data.drop(['labels'], axis=1)
y = data.loc[:, 'labels']

# print(pd.value_counts(y))  # 查看各个类别的个数

# 数据可视化
plt.figure(figsize=(10, 10))
label0 = plt.scatter(x.loc[:, 'V1'][y == 0], x.loc[:, 'V2'][y == 0])
label1 = plt.scatter(x.loc[:, 'V1'][y == 1], x.loc[:, 'V2'][y == 1])
label2 = plt.scatter(x.loc[:, 'V1'][y == 2], x.loc[:, 'V2'][y == 2])
plt.title('title')
plt.xlabel('v1')
plt.ylabel('v2')
plt.legend((label0, label1, label2), ('label0', 'label1', 'label2'))
# plt.show()

km_model = KMeans(n_clusters=3, random_state=0)
km_model.fit(x)
center = km_model.cluster_centers_
# print("中心点", center)
# print(center[:,0],center[:,1])
plt.scatter(center[:, 0], center[:, 1], color='black')
plt.show()

# 计算准确率
y_predict = km_model.predict(x)
print(accuracy_score(y, y_predict))


# 可视化结果索引
plt.figure(figsize=(10, 10))
label0 = plt.scatter(x.loc[:, 'V1'][y_predict == 0], x.loc[:, 'V2'][y_predict == 0])
label1 = plt.scatter(x.loc[:, 'V1'][y_predict == 1], x.loc[:, 'V2'][y_predict == 1])
label2 = plt.scatter(x.loc[:, 'V1'][y_predict == 2], x.loc[:, 'V2'][y_predict == 2])
plt.title('title')
plt.xlabel('v1')
plt.ylabel('v2')
plt.legend((label0, label1, label2), ('label0', 'label1', 'label2'))
plt.show()

# 矫正数据
y_corrected = []
for i in y_predict:
    if i == 0:
        y_corrected.append(1)
    elif i == 1:
        y_corrected.append(2)
    else:
        y_corrected.append(0)

print(accuracy_score(y,y_corrected))

# 可视化结果索引

y_corrected = np.array(y_corrected)

plt.figure(figsize=(10, 10))
label0 = plt.scatter(x.loc[:, 'V1'][y_corrected == 0], x.loc[:, 'V2'][y_corrected == 0])
label1 = plt.scatter(x.loc[:, 'V1'][y_corrected == 1], x.loc[:, 'V2'][y_corrected == 1])
label2 = plt.scatter(x.loc[:, 'V1'][y_corrected == 2], x.loc[:, 'V2'][y_corrected == 2])
plt.title('title')
plt.xlabel('v1')
plt.ylabel('v2')
plt.legend((label0, label1, label2), ('label0', 'label1', 'label2'))
plt.show()
 x = data.drop(['labels'], axis=1)
y = data.loc[:, 'labels']
  1. 第一行代码 x = data.drop(['labels'], axis=1) 的作用是从data中删除(或者说“丢弃”)名为labels的列,并将结果赋值给x。这里axis=1指定了操作是沿着列(columns)方向进行的,即删除列而不是行。因此,x将包含data中除了labels列之外的所有列。

  2. 第二行代码 y = data.loc[:, 'labels'] 的作用是从data中选取名为labels的列,并将结果赋值给y。这里.loc[]是一个基于标签的索引器,用于通过行标签和列标签来选取数据。在这个例子中,:表示选取所有的行,'labels'表示选取名为labels的列。因此, y将只包含data中的labels列。

plt.figure(figsize=(10, 10))
label0 = plt.scatter(x.loc[:, 'V1'][y == 0], x.loc[:, 'V2'][y == 0])
label1 = plt.scatter(x.loc[:, 'V1'][y == 1], x.loc[:, 'V2'][y == 1])
label2 = plt.scatter(x.loc[:, 'V1'][y == 2], x.loc[:, 'V2'][y == 2])
plt.title('title')
plt.xlabel('v1')
plt.ylabel('v2')
plt.legend((label0, label1, label2), ('label0', 'label1', 'label2'))
  1. plt.figure(figsize=(10, 10)): 创建了一个新的图形,其大小为10x10英寸。figsize参数用于设置图形的宽度和高度 。

  2. 接下来的三行代码分别使用plt.scatter()函数根据y中的标签(0, 1, 2)x中的点绘制成三种不同的颜色或标记。这里,x.loc[:, 'V1'][y == 0]表示选取x中所有行、'V1’列,并且这些行的标签(y的值)等于0的点的’V1’值。同理,'V2'和其他标签(1, 2)也是类似的逻辑。

  3. plt.legend((label0, label1, label2), ('label0', 'label1', 'label2')):添加图例。label0label1label2是之前通过plt.scatter()返回的散点图对象,它们分别代表三个不同标签的点的集合。

在这里插入图片描述

  • Meanshift实现聚类
data = pd.read_csv('data.csv')
 
x = data.drop(['labels'], axis=1)
y = data.loc[:, 'labels']

r = estimate_bandwidth(x, n_samples=50000)
# print(r)

ms_model = MeanShift(bandwidth=r)
ms_model.fit(x)
y_pred = ms_model.predict(x)
print(pd.value_counts(y_pred))
print(pd.value_counts(y))

# 数据矫正(0->2,1->1,2->0)
y_corrected = []
for i in y_pred:
    if i == 0:
        y_corrected.append(2)
    elif i == 1:
        y_corrected.append(1)
    else:
        y_corrected.append(0)

print(accuracy_score(y, y_corrected))
  • 首先使用了estimate_bandwidth函数来估计数据集x的带宽r,这个带宽随后被用作MeanShift聚类算法的参数。然后,使用估计得到的带宽r来初始化MeanShift模型,并对数据集x进行拟合,最后对同一数据集x进行预测以获取聚类标签y_pred

  • KNN实现分类

knn_model = KNeighborsClassifier(n_neighbors=3)
knn_model.fit(x, y)
y_pred = knn_model.predict(x)
  • 首先使用fit方法对训练数据集x和对应的标签y进行训练。然后,使用predict方法尝试对相同的数据集x进行预测。

在这里插入图片描述

7、上述三种算法总结

  • KNN:是监督学习方法的一种,用于分类和回归。它依赖于已知标签的数据集来对新数据进行分类或预测。

  • Kmeans:是无监督学习方法的一种,主要用于聚类分析。它不需要数据集的标签信息,而是根据数据之间的相似度将数据分为若干个簇。

  • Meanshift:同样属于无监督学习方法,也是用于聚类分析。它通过迭代过程寻找数据的聚类中心,与Kmeans类似,但具有更强的自适应性和对噪声的鲁棒性。

    1. 算法原理
  • KNN:通过计算待分类样本与训练集中各样本之间的距离,找出距离该样本最近的k个邻居,并根据这k个邻居的类别信息,采用多数投票或加权平均等方法来确定待分类样本的类别。

  • Kmeans:随机选择k个数据点作为初始簇中心,然后根据数据点到簇中心的距离将数据点分配到最近的簇中,之后更新簇中心为簇内所有点的均值,重复此过程直到簇中心不再发生变化或达到预设的迭代次数。

  • Meanshift:从一组数据点中随机选择一个点作为初始中心点,然后根据一定的带宽(或称为窗口大小)计算该中心点周围的数据点的密度,并更新中心点位置为密度加权的平均值,重复此过程直到中心点收敛或达到预设的迭代次数。

  1. 应用场景
  • KNN:适用于分类和回归问题,特别是当数据集较大且类别分布较为均匀时。由于其简单直观,KNN也常用于初步的数据分析和探索性学习中。
  • Kmeans:广泛应用于聚类分析领域,如市场细分、图像处理、文本聚类等。Kmeans能够快速地将数据分为若干个簇,帮助人们理解数据的内在结构和分布规律。
  • Meanshift:由于其自适应性和对噪声的鲁棒性,Meanshift算法在复杂数据集的聚类分析中表现出色。特别是在处理具有不规则形状或重叠簇的数据集时,Meanshift算法往往能够取得比Kmeans更好的聚类效果。
  1. 优缺点
  • KNN:优点包括简单易用、模型训练时间快、预测效果好等;缺点则包括对内存要求较高、预测阶段可能较慢、对不相关的功能和数据规模敏感等。
  • Kmeans:优点在于实现简单、聚类效果好、计算复杂度低;缺点则包括需要事先指定簇的个数k、对初始簇中心的选择敏感、可能陷入局部最优解等。
  • Meanshift:优点在于自适应性强、对噪声鲁棒性强、能够处理复杂形状和重叠簇的数据集;缺点则包括计算复杂度较高、对带宽的选择敏感等。

Ⅱ、机器学习其他常用技术

1、决策树基本知识

  • 决策树 是一种常用的监督学习算法,用于分类和回归任务。它主要通过树状图的形式来表现数据分类的过程,每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,而每个叶节点代表一种分类结果。决策树模型易于理解和解释,同时能够处理具有不相关特征的数据。

构建决策树的过程通常包括以下几个步骤:

  1. 特征选择:从给定的特征集中选择一个最优特征来分割数据集,使得分割后的数据集更加“纯净”或“一致”(即同一类别的数据尽可能在同一个子集中)。

  2. 决策树生成:按照选择的特征,将数据集分割成若干个子集,并为每个子集递归地选择最优特征进行分割,直到满足停止条件(如子集纯度足够高、所有特征都已使用、子集中的样本数小于预设阈值等)。

  3. 决策树剪枝:由于决策树容易过拟合,即模型在训练数据上表现很好,但在新数据上表现不佳,因此需要通过剪枝来简化决策树,提高模型的泛化能力。剪枝分为预剪枝和后剪枝,前者在决策树生成过程中进行,后者在决策树生成后进行。

决策树的优点

  • 能够处理不相关特征:通过特征选择,决策树可以自动忽略不相关特征。
  • 可以处理非线性关系:决策树模型能够捕获变量之间的非线性关系。
  • 适合高维数据:决策树不需要对特征进行缩放或中心化处理,适用于高维数据。

决策树的缺点

  • 容易过拟合:如果决策树过于复杂,可能会导致过拟合。
  • 不稳定性:数据的小变化可能会导致生成的决策树结构发生显著变化。
  • 不适合处理连续变量:虽然可以通过离散化连续变量来处理,但这会增加模型的复杂度。

首先引入常用分类方法

在这里插入图片描述

  • 一种对实例进行分类的树形结构,通过多层判断区分目标所属类别
  • 本质:通过多层判断,从训练数据集中归纳出一组分类规则

优点:

  • 计算量小,运算速度快,易于理解,可清晰查看各属性的重要性

缺点:

  • 忽略属性间的相关性,样本类别分布不时,容易影响模型表现

决策树 求解
在这里插入图片描述

在这里插入图片描述
Ent(D)的值越小,变量的不确定性越小。

在这里插入图片描述

目标:划分后样本分布不确定性尽可能小,即划分后信息熵小,信息增益大

2、异常检测概念

  • 在基于高斯分布(也称为正态分布)的异常检测中,通常使用数据的均值( μ \mu μ)和标准差( σ \sigma σ)来评估数据点的正常性或异常性。一个常用的方法是计算数据点到其分布均值的距离,并将其与标准差进行比较,以此来判断该数据点是否异常。

高斯分布的概率密度函数

f ( x ∣ μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 n i n i f(x | \mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}nini f(xμ,σ2)=2πσ2 1e2σ2(xμ)2nini

其中, x x x 是随机变量, μ \mu μ 是均值, σ 2 \sigma^2 σ2 是方差,而 σ \sigma σ 是标准差。

  • 在异常检测中,我们可能会定义一个阈值(比如,基于标准差的数量),超过这个阈值的数据点被认为是异常的。例如,一个常用的方法是使用 3 σ 3\sigma 3σ规则,即认为距离均值超过 3 σ 3\sigma 3σ的数据点是异常的。这可以表达为:

∣ x − μ ∣ > 3 σ |x - \mu| > 3\sigma xμ>3σ

如果 x x x满足上述不等式,则 x x x被视为异常值。

在这里插入图片描述

3、主成分分析

数据降维

一、定义

  • 数据降维是通过保留数据的主要信息和结构,将高维数据转换为低维表示的过程。它旨在消除冗余和噪声,提炼出数据的最重要的方面,从而简化数据分析和可视化的任务。

二、目的

  1. 减少计算复杂性:高维数据可能导致计算资源的浪费,数据降维可以减少计算的时间和空间复杂性,提高模型的训练和预测效率。
  2. 消除冗余信息:高维数据中可能存在冗余特征,这些特征对模型的训练并没有太大的帮助,甚至可能引起过拟合。数据降维可以消除这些冗余信息,提高模型的泛化能力。
  3. 可视化和解释性:降维后的数据可以更容易地进行可视化和解释,帮助我们更好地理解数据和模型的特征。

三、方法

数据降维的方法主要分为两类:特征选择和主成分分析(PCA)。

  1. 特征选择

    • 定义:在所有特征中选择部分特征作为训练集特征,选择后特征的值不改变,但是选择后的特征维数会降低。
  2. 主成分分析(PCA)

    • 定义:PCA是一种分析、简化数据集的技术,其核心在于数据维度压缩,尽可能降低原数据的维度,同时损失少量信息。
    • 原理:通过线性变换将原始数据映射到一个新的低维空间中,这个新空间是由原始数据的主成分(即方差最大的方向)构成的。
    • 步骤
      1. 标准化数据:将原始数据进行标准化处理,使其满足正态分布。
      2. 计算协方差矩阵:计算数据矩阵的协方差矩阵。
      3. 计算特征值和特征向量:将协方差矩阵的特征值和特征向量进行排序,选择Top-k个特征值和对应的特征向量。
      4. 构建降维矩阵:将Top-k个特征向量构建成降维矩阵。
      5. 进行降维:将原始数据矩阵与降维矩阵进行乘积运算,得到降维后的数据矩阵。

如何保留主要信息:投影后的不同特征数据尽可能分得开(即不相关)

计算过程:

  • 原始数据预处理(标准化:u=0 σ=1)
  • 计算协方差矩阵特征向量、及数据在各特征向量投影后的方差
  • 根据需求(任务指定或方差比例)确定降维维度k
  • 选取k维特征向量,计算数据在其形成空间的投影

4、决策树代码实现

  • 决策树官方文档

https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn.tree.DecisionTreeClassifier

在这里插入图片描述

# 决策树模型
from sklearn import tree

from sklearn.metrics import accuracy_score

from matplotlib import pyplot as plt

# 加载数据
data = pd.read_csv('iris_data.csv')

x = data.drop(['target', 'label'], axis=1)
y = data.loc[:, 'label']
# print(x.shape, y.shape)

# 训练模型
dc_tree = tree.DecisionTreeClassifier(criterion='entropy', min_samples_leaf=1)
dc_tree.fit(x, y)

y_pred = dc_tree.predict(x)
print(accuracy_score(y, y_pred))

# 画图
plt.figure(figsize=(30, 30))
tree.plot_tree(dc_tree, filled=True,
               feature_names=['sepal length', 'sepal width', 'petal length', 'petal width']
               , class_names=['Iris-setosa', 'Iris-versicolor', 'Iris-virginica'])
# plt.show()
# 下载图片
plt.savefig('iris_tree2.png')

在这里插入图片描述

5、基于高斯分布的异常检测代码

在这里插入图片描述

 from scipy.stats import norm
x1_range = np.linspace(0,20,300)
x1_normal = norm.pdf(x1_range,x1_mean,x1_sigma)
x2_range = np.linspace(0,20,300)
x2_normal = norm.pdf(x2_range,x2_mean,x2_sigma)

在这里插入图片描述

  • 1、通过计算数据各维度对应的高斯分布概率密度函数,可用于寻找到数据中的异常点;
  • 2、通过修改概率密度阈值contamination,可调整异常点检测的灵敏度;

6、主成分分析代码实现

实现步骤

  • 1、基于iris_data.csv数据,建立KNN模型实现数据分类(n_neighbors=3)
  • 2、对数据进行标准化处理,选取一个维度可视化处理后的效果
  • 3、进行与原数据等维度PCA,查看各主成分的方差比例
  • 4、保留合适的主成分,可视化降维后的数据
  • 5、基于降维后数据建立KNN模型,与原数据表现进行对比

在这里插入图片描述

# 建立KNN模型
KNN_MODE = KNeighborsClassifier(n_neighbors=3)
KNN_MODE.fit(X, Y)
y_pred = KNN_MODE.predict(X)
print(accuracy_score(Y, y_pred))

# 标准化处理
x_norm = StandardScaler().fit_transform(X)
# 计算处理后的数据的均值和标准差
x_mean = x_norm.mean()
x_std = x_norm.std()
# 打印均值和标准差
print(X.loc[:, 'sepal length'].mean(), x_mean)
print(X.loc[:, 'sepal length'].std(), x_std)

# 可视化处理
plt.figure(figsize=(10, 10))
plt.subplot(121)
plt.hist(X.loc[:, 'sepal length'], bins=100)
plt.title('sepal length')
plt.subplot(122)
plt.hist(x_norm[:, 0], bins=100)
plt.title('sepal length')
plt.show()

在这里插入图片描述

# PCA
pca = PCA(n_components=4)
x_pca = pca.fit_transform(x_norm)
# 打印方差
print(pca.explained_variance_ratio_)
# 可视化操作
plt.figure(figsize=(20, 10))
plt.bar([1, 2, 3, 4], pca.explained_variance_ratio_)
plt.xticks([1, 2, 3, 4], ['pca1', 'pca2', 'pca3', 'pca4'])
plt.show()
# 只保留2个维度
pca = PCA(n_components=2)
x_pca = pca.fit_transform(x_norm)
# print(x_pca.shape)

(二)论文复现工作

Ⅰ、项目准备运行工作

1、配置项目环境

  • 从以往的本地环境迁移至服务器环境,注意包的版本号
    在这里插入图片描述

2、连接4090运行项目

在这里插入图片描述

3、进行映射至服务器

在这里插入图片描述

在这里插入图片描述

Ⅱ、复现过程中问题及其解决方案

1、dtensor问题及其解决方案

解决方案:

pip install keras==2.6

在这里插入图片描述

2、np.object问题及其解决方案

解决方案:
AttributeError: module numpy has no attribute object . np.object

pip install -U numpy==1.20.3

在这里插入图片描述

3、protocol问题及其解决方案

解决方案:
在这里插入图片描述

pip install protocol==3.19.0

或更新torchvision

在这里插入图片描述

这个更新好久哇😢

4、num_samples 问题及其解决方案

  • 本质是路径问题,找不到文件当然没有num_samples
    在这里插入图片描述
    在这里插入图片描述
    通过层层发现 实际是路径的问题
    在这里插入图片描述
    开始上传路径缺失的文件
    在这里插入图片描述
  • 关于文件大上传服务器技巧: 可以进行压缩上传 突然想到😄
unzip test.zip

在这里插入图片描述

5、torch.cuda.FloatTensor问题及其解决方案

在这里插入图片描述

  • 输入的数据类型为torch.cuda.FloatTensor,说明输入数据在GPU中模型参数的数据类型为torch.FloatTensor,说明模型还在CPU
    问题原因搞清楚了,模型没加载到CPU,在代码中加一行语句就可以了
model = model.cuda()
model = model.to('cuda')
model.cuda()
model.to('cuda')

上面四行任选一,还有其他未列出的表述方法,都可以将模型加载到GPU。

  • 反之Input type (torch.FloatTensor) and weight type (torch.cuda.FloatTensor) should be the问题来源是输入数据没有加载到GPU,解决方法为任选其一
tensor = tensor.cuda()
tensor = tensor.to('cuda')

Ⅲ、折腾了好久终于开始炼丹

1、训练过程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 性能确实不错,我自己电脑本地运行一两天都不一定训练完成,4090一两小时就训练好了

2、预测过程

在这里插入图片描述
在这里插入图片描述

  • 看一下运行完成后所占的空间
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1905543.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【SpringCloud应用框架】Nacos服务配置中心

第四章 Spring Cloud Alibaba Nacos之服务配置中心 文章目录 一、基础配置二、新建子项目1.pom文件2.YML配置3.启动类4.业务类5.Nacos配置规则 三、Nacos平台创建配置操作四、自动配置更新五、测试 一、基础配置 Nacos不仅仅可以作为注册中心来使用,同时它支持作为…

算法:[动态规划] 斐波那契数列模型

目录 题目一:第 N 个泰波那契数 题目二:三步问题 题目三:最小花费爬楼梯 题目四:解码方法 题目一:第 N 个泰波那契数 泰波那契序列 Tn 定义如下: T0 0, T1 1, T2 1, 且在 n > 0 的条件下 Tn3 …

CAN总线(下)

位时序 为了灵活调整每个采样点的位置,使采样点对齐数据位中心附近,CAN总线对每一个数据位的时长进行了更细的划分, 分为同步段(SS)、传播时间段(PTS)、相位缓冲段1(PBS1&#xff0…

【Threejs进阶教程-优化篇】4.Vue/React与threejs如何解决冲突和卡顿(续)

Vue/React与threejs如何解决冲突和卡顿-续 使用说明核心思路环境搭建(vuethree)vue运行机制分析业务分离使用threejs做背景 3D模块封装使用ES6的Class来让逻辑性更强Threejs尽量按需引入创建一个类扩展写法本次代码执行顺序 扩展内容添加orbitControls和辅助线解决事件覆盖 与V…

程序员学长 | 快速学会一个算法,xLSTM

本文来源公众号“程序员学长”,仅用于学术分享,侵权删,干货满满。 原文链接:快速学会一个算法,xLSTM 今天给大家分享一个超强的算法模型,xLSTM。 xLSTM(Extended Long Short-Term Memory&…

AI大模型的智能心脏:向量数据库的崛起

在人工智能的飞速发展中,一个关键技术正悄然成为AI大模型的智能心脏——向量数据库。它不仅是数据存储和管理的革命性工具,更是AI技术突破的核心。随着AI大模型在各个领域的广泛应用,向量数据库的重要性日益凸显。 01 技术突破:向…

水箱高低水位浮球液位开关工作原理

工作原理 水箱高低水位浮球液位开关是一种利用浮球随液位升降来实现液位控制的设备。其基本原理是浮球在液体的浮力作用下上下浮动,通过磁性作用驱动与之相连的磁簧开关的开合,从而实现液位的高低控制和报警。当液位升高时,浮球上浮&#xf…

Jmeter实现接口自动化

自动化测试理论知识 什么是自动化测试? 让程序或工具代替人为执行测试用例什么样的项目适合做自动化? 1、项目周期长 --多长算长?(自己公司运营项目) 2、需求稳定(更多具体功能/模块) 3、需要…

LabVIEW机器视觉系统中的图像畸变、校准和矫正

在机器视觉应用中,图像畸变、校准和矫正是确保图像准确性的关键步骤。LabVIEW作为一种强大的图像处理和分析工具,提供了一系列功能来处理这些问题。以下是对图像畸变、校准和矫正的详细介绍。 图像畸变 图像畸变 是指由于摄像镜头的光学特性或拍摄角度问…

昇思25天学习打卡营第3天|MindSpore张量

# 打卡 目录 # 打卡 类 涉及知识点 1. 创建张量的4种方式 运行例子 2. 张量属性和索引 运行例子 3. 张量运算 运行例子 4. Tensor 与 Numpy 转换 5. 稀疏张量:CSR和COO CSRTensor 运行例子 COOTensor 运行例子 RowTensor 类 import mindspore from…

CMD命令详细介绍 | 超详细版本!

文章目录 启动cmd命令用户启动使用管理员的账号启动 文件夹命令网络命令其他常用命令介绍常用快捷方式程序员相关命令 本文参考了博客园一篇帖子,ULR:cmd常用命令介绍(可收藏) - Mrwhite86 - 博客园 (cnblogs.com) CMD是Windows操作系统自带的命令行解释…

【Linux】打包命令——tar

打包和压缩 虽然打包和压缩都涉及将多个文件组合成单个实体,但它们之间存在重要差异。 打包和压缩的区别: 打包是将多个文件或目录组合在一起,但不对其进行压缩。这意味着打包后的文件大小可能与原始文件相同或更大。此外,打包…

【工具分享】Gophish

文章目录 Gophish安装方式功能简介 Gophish Gophish 是一个开源的网络钓鱼框架,它被设计用于模拟真实世界的钓鱼攻击,以帮助企业和渗透测试人员测试和评估他们的网络钓鱼风险。Gophish 旨在使行业级的网络钓鱼培训对每个人都是可获取的,它易…

文件存储的方法一

文章目录 概念介绍实现方法示例代码 我们在上一章回中介绍了"如何实现本地存储"相关的内容,本章回中将介绍如何实现文件存储.闲话休提,让我们一起Talk Flutter吧。 概念介绍 我们在上一章回中介绍的本地存储只能存储dart语言中基本类型的数值…

鲨疯了,免费的Viva又能画图,又能做视频,又能......

theme: smartblue 点赞 关注 收藏 学会了 本文简介 众所周知,Midjourney擅长画画,Runway擅长做视频(Sora也说它可以做)。 Viva:我不是针对你,我只想说在座的各位都是乐色~ 注意,它叫Viva,不是…

Java引用的4种类型:强、软、弱、虚

在Java中,引用的概念不仅限于强引用,还包括软引用、弱引用和虚引用(也称为幻影引用)。这些引用类型主要用于不同的内存管理策略,尤其是在垃圾收集过程中。以下是对这四种引用类型的详细解释: 1. 强引用&am…

GD32实战篇-双向数控BUCK-BOOST-BUCK降压理论基础

本文章基于兆易创新GD32 MCU所提供的2.2.4版本库函数开发 向上代码兼容GD32F450ZGT6中使用 后续项目主要在下面该专栏中发布: https://blog.csdn.net/qq_62316532/category_12608431.html?spm1001.2014.3001.5482 感兴趣的点个关注收藏一下吧! 电机驱动开发可以跳转…

论文解析——FTRANS: Energy-Efficient Acceleration of Transformers using FPGA

作者及发刊详情 Li B , Pandey S , Fang H ,et al.FTRANS: energy-efficient acceleration of transformers using FPGA[J].ACM, 2020.DOI:10.1145/3370748.3406567. 摘要 正文 主要工作贡献 与CPU和GPU在执行Transformer和RoBERTa相比,提出的FTRANS框架获得了…

计算云服务2

第二章 裸金属服务器 什么是裸金属服务器(BMS) 裸金属服务器(Bare Metal Server,BMS)是一款兼具虚拟机弹性和物理机性能的计算类服务为用户以及相关企业提供专属的云上物理服务器,为核心数据库、关键应用系统、高性能计算、大数据等业务提供卓越的计算…

买的Google账号登录,修改辅助邮箱收不到验证码?可能是个简单的错误

这篇文章分享一个案例,购买了谷歌账号以后如何修改辅助邮箱,修改辅助邮箱的一些要点,以及常见的一个错误。 一、案例回放 这个朋友昨天在我的一个视频下面留言说买了谷歌账号以后,想修改辅助邮箱地址,但是输入了辅助…