《精通特征工程》学习笔记(6):非线性特征化与k-均值模型堆叠

news2025/1/16 11:11:30

1.非线性特征

当数据位于一个薄饼状的线性子空间时,PCA 是非常有用的。但如果数据形成了一个更加复杂的形状,情况又将如何呢?
在这里插入图片描述

如果线性子空间是一张平展的纸,那么非线性流形的一个简单例子就是卷起来的纸,它有
个非正式的名称,叫作瑞士卷。一旦卷了起来,二维平面就占据了三维空间,尽管它本质上还是个二维对象。换句话说,它具有低本征维数。如果能够以某种方式展开瑞士卷,就可以恢复二维平面。这就是非线性数据降维的目标,它假定流形要比它所在的全维度空间简单,然后试图将其展开。

流形能够展开的关键在于,即使一个大的流形看上去非常复杂,但它的每个数据点的邻近区域通常可以非常好地近似为一块平面。换句话说,可以通过多个小平面使用局部结构组成全局结构。非线性数据降维也称为非线性嵌入或流形学习。非线性嵌入可以非常有效地将高维数据压缩为低维数据,常用于二维空间或三维空间中的可视化。

但是,尽量降低特征维度只是特征工程目标的一小部分,它的根本目标还是为当前任务找
到正确的特征。

聚类算法通常不被用作局部结构学习技术,但实际上它完全可以胜任。彼此相近(可以用一种特定的度量方式来定义“近”的概念)的点属于同一个簇。给定一个聚类,数据点可以用它的簇成员向量来表示。如果簇的数量小于初始的特征数量,那么相对于初始表示,这种新表示就具有更少的维度,初始数据就被压缩进一个更低维度的空间。

2.模型堆叠

核心思想:先使用复杂的基础层(通常带有昂贵的模型)生成良好的(通常是非线性的)特征,再与简单快速的顶层模型组合起来。这样通常能实现模型准确率和速度之间的正确平衡,即多个模型的堆叠。

3.K均值聚类过程

下列代码展示了在两种不同的、随机生成的数据集上的 k-均值聚类。(a) 中的数据是使用几种随机高斯分布生成的,这些分布的方差相同但均值不同。© 中的数据则是完全随机生成的。这些用于实验的问题非常容易解决,k-均值聚类的效果非常好。(聚类结果对簇的数目非常敏感,簇数目必须在算法中给定。)

import numpy as np
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs

import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib notebook
n_data = 1000
seed = 1
n_centers = 4

# 生成符合高斯分布的数据
blobs, blob_labels = make_blobs(n_samples=n_data, n_features=2, 
                                centers=n_centers, random_state=seed)
# 运行算法
clusters_blob = KMeans(n_clusters=n_centers, random_state=seed).fit_predict(blobs)# 聚类是直接训练并分好类

# 生成完全随机的数据
uniform = np.random.rand(n_data, 2)
clusters_uniform = KMeans(n_clusters=n_centers, random_state=seed).fit_predict(uniform)
figure = plt.figure(figsize=(20,10))
plt.subplot(221)
plt.scatter(blobs[:, 0], blobs[:, 1], c=blob_labels, edgecolors='k', cmap='PuRd')
plt.title("(a) Four randomly generated blobs", fontsize=14)
plt.axis('off')

plt.subplot(222)
plt.scatter(blobs[:, 0], blobs[:, 1], c=clusters_blob, edgecolors='k', cmap='PuRd')
plt.title("(b) Clusters found via K-means", fontsize=14)
plt.axis('off')

plt.subplot(223)
plt.scatter(uniform[:, 0], uniform[:, 1], edgecolors='k')
plt.title("(c) 1000 randomly generated pois", fontsize=14)
plt.axis('off')

plt.subplot(224)
plt.scatter(uniform[:, 0], uniform[:, 1], c=clusters_uniform, edgecolors='k', cmap='PuRd')
plt.title("(d) Clusters found via K-means", fontsize=14)
plt.axis('off')

在这里插入图片描述

4.使用K聚类进行非线性特征(曲面/非平面)的降维

使用K聚类对非线性特征(比如曲面性特征)的聚类,得到输出,作为下一个模型的输入。

一般的聚类应用假定在数据中可以找到自然形成的簇,也就是说,空间中分布着一些密集
数据区域,空间的其他部分则相对空旷。在这种情况下,需要确定正确的簇数目,而为了
选择这个 k,人们发明了聚类索引来测量数据分组的质量。

使用 scikit-learn 在瑞士卷上生成了一个带噪声的数据集,对其使用 k-均值算法进行了
聚类,并使用 Matplotlib 对聚类结果进行了可视化。数据点按照它们的簇 ID 进行了着色。

from mpl_toolkits.mplot3d import Axes3D
from sklearn import manifold
from sklearn.datasets import make_swiss_roll

# 生成带噪声的非线性数据集(例如卷状)
X, color = make_swiss_roll(n_samples=1500)

# 使用100个k-均值簇对数据进行近似: 聚成100个类,当然,实际上可以使用交叉验证或者重复K
clusters_swiss_roll = KMeans(n_clusters=100, random_state=seed).fit_predict(X)
# 曲面数据的聚类无疑就是增加簇的个数
fig2 = plt.figure()
ax = fig2.add_subplot(111, projection='3d')
ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=clusters_swiss_roll, cmap='Spectral')

在这里插入图片描述

5.用于分类问题的K均值特征化(模型堆叠)

聚类算法可以分析数据的空间分布,因此,k-均值特征化可以生成数据的压缩空间索引,供下一阶段的模型使用。这就是模型堆叠的一个例子。

如果还有目标变量,那么也可以将目标变量中的信息作为聚类过程的提示。加入目标变量信息的一种方法是,直接将目标变量作为 k-均值算法的一个额外输入特征。因为我们的目标是将所有输入维度上的欧氏距离的总和最小化,所以聚类过程除了在初始特征空间中以外,也会在目标变量值之间平衡相似度。可以对目标变量进行缩放,来增加或减少聚类算法对它的关注程度。目标变量之间的差距较大时,会生成更加注重分类边界的簇。

可以有选择地为 k-均值提供类标签作为输入,这有助于 k-均值找到与类别边界更加对齐的簇。

(1)构造K均值特征

import numpy as np
from scipy.spatial import Voronoi, voronoi_plot_2d
from sklearn.cluster import KMeans
from sklearn.datasets import make_moons
from sklearn.preprocessing import OneHotEncoder
import sklearn
import scipy

import matplotlib.pyplot as plt
%matplotlib notebook
class KMeansFeaturizer:
    """将数值数据转换为k-means集群成员.
    
    这个转换器对输入数据运行k-means,并将每个数据点转换为最近集群的id。
    如果存在一个目标变量,则将其作为k-means的输入进行缩放,以导出遵从分类边界的簇,并将相似点分组在一起。.

    Parameters
    ----------
    k: integer, optional, default 100;
        将数据分组到的集群的数量。.

    target_scale: float, [0, infty], optional, default 5.0
                目标变量的比例因子。将其设置为零则忽略目标。对于分类问题,较大的“target_scale”值将产生更好地尊重类边界的集群。

    random_state : integer or numpy.RandomState, optional
                    它被传递给k-means作为初始化kmeans中心的生成器。如果给定一个整数,它会修复种子。默认为全局numpy随机数生成器。

    Attributes
    ----------
    cluster_centers_ : array, [k, n_features]
        集群中心坐标。n_features对目标列进行计数。
    """

    def __init__(self, k=100, target_scale=5.0, random_state=None):
        self.k = k
        self.target_scale = target_scale
        self.random_state = random_state
        self.cluster_encoder = OneHotEncoder().fit(np.array(range(k)).reshape(-1,1))
        
    def fit(self, X, y=None):
        """对输入数据运行k-means并找到质心。

        如果没有给定目标(' y '为None),那么在输入' X '上运行普通的k-means。

        如果给定了目标' y ',那么包括目标(由' target_scale '加权)作为k-means聚类的额外维度。
        在这种情况下,运行两次k-means,第一次运行目标,然后再运行一次没有目标的额外迭代。

        拟合后,属性' cluster_centers_ '被设置为输入空间中由' X '表示的k-means中心。

        Parameters
        ----------
        X : array-like or sparse matrix, shape=(n_data_points, n_features)

        y : 长度为n_data_points的向量,可选,默认None;
            如果提供,将用“target_scale”进行加权,并包含在k-means集群中作为提示。
        """
        if y is None:
            # 不用目标变量,只用k均值
            km_model = KMeans(n_clusters=self.k, 
                              n_init=20, 
                              random_state=self.random_state)
            km_model.fit(X)

            self.km_model_ = km_model
            self.cluster_centers_ = km_model.cluster_centers_
            return self

        # 有目标信息。应用适当的缩放并将其包含到k-means的输入数据中         
        data_with_target = np.hstack((X, y[:,np.newaxis]*self.target_scale))

        # 在数据和标签上建立K-means模型。
        km_model_pretrain = KMeans(n_clusters=self.k, 
                                   n_init=20, 
                                   random_state=self.random_state)
        km_model_pretrain.fit(data_with_target)

        # 运行k-means--第二次在没有目标信息的情况下在原始空间中获取集群。使用训练前发现的中心进行初始化。
        # 通过单一的聚类分配迭代和质心重新计算。
        km_model = KMeans(n_clusters=self.k, 
                          init=km_model_pretrain.cluster_centers_[:,:2], 
                          n_init=1, 
                          max_iter=1)
        km_model.fit(X)
        
        self.km_model = km_model
        self.cluster_centers_ = km_model.cluster_centers_
        return self
        
    def transform(self, X, y=None):
        """为每个输入数据点输出最近的集群id。

        Parameters
        ----------
        X : array-like or sparse matrix, shape=(n_data_points, n_features)

        y : vector of length n_data_points, optional, default None
            标签向量被忽略,即使提供。

        Returns
        -------
        cluster_ids : array, shape[n_data_points,1]
        """
        clusters = self.km_model.predict(X)
        return self.cluster_encoder.transform(clusters.reshape(-1,1))
    
    def fit_transform(self, X, y=None):
        """运行fit之后是transform转换特征。
        """
        self.fit(X, y)
        return self.transform(X, y)

生成数据

seed = 1
training_data, training_labels = make_moons(n_samples=2000, noise=0.2, random_state=seed)

进行特征转换,可以使用transform()方法获取到转换后的特征数据。

kmf_hint = KMeansFeaturizer(k=100, target_scale=10, random_state=seed).fit(training_data, training_labels)
kmf_no_hint = KMeansFeaturizer(k=100, target_scale=0, random_state=seed).fit(training_data, training_labels)

绘制数据

def kmeans_voronoi_plot(X, y, cluster_centers, ax):
    """绘制覆盖数据的kmeans集群的Voronoi图"""
    ax.scatter(X[:, 0], X[:, 1], c=y, cmap='Set1', alpha=0.2)
    vor = Voronoi(cluster_centers)
    voronoi_plot_2d(vor, ax=ax, show_vertices=False, alpha=0.5)
fig = plt.figure()
ax = plt.subplot(211, aspect='equal')
kmeans_voronoi_plot(training_data, training_labels, kmf_hint.cluster_centers_, ax)
ax.set_title('K-Means with Target Hint')
# 使用目标类信息的 k-均值聚类

ax2 = plt.subplot(212, aspect='equal')
kmeans_voronoi_plot(training_data, training_labels, kmf_no_hint.cluster_centers_, ax2)
ax2.set_title('K-Means without Target Hint')
# 不使用目标类信息的 k-均值聚类

在这里插入图片描述
如何获取到K均值转换后的特征数据呢?
可以使用transform()方法或者fit_transform方法获取。可以有选择地为 k-均值提供类标签作为输入,这有助于 k-均值找到与类别边界更加对齐的簇。

model = KMeansFeaturizer(k=100, target_scale=10, random_state=seed)
model.fit(training_data,training_labels)
# 这里new_x就是聚类后的数据
new_x = model.transform(training_data).toarray()
new_x,new_x.shape

(2)查看K均重特征对分类问题的效果

# 测试一下 k-均值特征对于分类问题的有效性。

# 使用与训练数据相同的分布生成一些测试数据
test_data, test_labels = make_moons(n_samples=2000, noise=0.3, random_state=seed+5)

# 使用k-均值特征生成器生成簇特征
training_cluster_features = kmf_hint.transform(training_data)
test_cluster_features = kmf_hint.transform(test_data)

# 使用簇特征构造新的输入特征
training_with_cluster = scipy.sparse.hstack((training_data, training_cluster_features))#矩阵拼接
test_with_cluster = scipy.sparse.hstack((test_data, test_cluster_features))
# 建立分类器
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier

lr_cluster = LogisticRegression(random_state=seed).fit(training_with_cluster, training_labels)#使用簇特征训练LR模型


# 使用没有进行K均值聚类特征化的数据进行训练模型,即使用原数据。
classifier_names = ['LR',
                    'kNN',
                    'RBF SVM',
                    'Random Forest',
                    'Boosted Trees']
classifiers = [LogisticRegression(random_state=seed),
               KNeighborsClassifier(5),
               SVC(gamma=2, C=1, random_state=seed),
               RandomForestClassifier(max_depth=5, n_estimators=10, 
                                      max_features=1, random_state=seed),
               GradientBoostingClassifier(n_estimators=10, learning_rate=1.0,
                                          max_depth=5, random_state=seed)]
for model in classifiers:
    model.fit(training_data, training_labels)
# 使用ROC评价分类器性能的辅助函数
def test_roc(model, data, labels):
    if hasattr(model, "decision_function"):
        predictions = model.decision_function(data)
    else:
        predictions = model.predict_proba(data)[:,1]
    fpr, tpr, _ = sklearn.metrics.roc_curve(labels, predictions)
    return fpr, tpr
# 绘制结果
plt.figure()
fpr_cluster, tpr_cluster = test_roc(lr_cluster, test_with_cluster, test_labels)
plt.plot(fpr_cluster, tpr_cluster, 'r-', label='LR with k-means')

for i, model in enumerate(classifiers):
    fpr, tpr = test_roc(model, test_data, test_labels)
    plt.plot(fpr, tpr, label=classifier_names[i])
    
plt.plot([0, 1], [0, 1], 'k--')
plt.legend()
plt.xlabel('False Positive Rate', fontsize=14)
plt.ylabel('True Positive Rate', fontsize=14)
# 一个好的分类器应该能快速地达到很高的真阳性率和很低的假阳性率,所以,能快速靠近左上角的曲线是极好的。

在这里插入图片描述

6.密集向量特征化(可以使用更小的K)

如果不使用 one-hot 编码的簇隶属关系,还可以使用一个密集向量来表示数据点,这个向量由数据点到每个簇中心点距离的倒数组成。相对于简单的二值化簇分配,这种方式可以保留更多的信息,只不过表示方式是密集的。这就是一种妥协。one-hot 编码的簇隶属关系可以提供一种非常轻量的、稀疏的表示,但需要一个比较大的 k 值来表示形状复杂的数据。距离倒数表示法是密集的,对于建模的各个步骤来说代价更高,但优点是可以使用更小的 k。

稀疏表示和密集表示之间的一种折中方案是,只保留 p 个最近簇的距离倒数。但这样一
来,又多了一个需要调优的超参数 p。(现在你能理解为什么特征工程需要考虑这么多细节
了吧?)世间没有免费的午餐。

7.优点、缺点以及陷阱

使用 k-均值将空间数据转换为特征是模型堆叠的一个实例,其中一个模型的输入是另一个模型的输出。另一个堆叠实例是使用决策树类型模型(随机森林或梯度提升树)的输出作为线性分类器的输入。

近年来,模型堆叠已经成为了一种越来越流行的技术,因为训练和维护非线性模型的成本非常高昂。堆叠的核心思想是将非线性放入特征中,再使用一种非常简单的、通常是线性的模型作为最后一层。特征生成器可以在线下训练,这意味着我们可以使用昂贵的、需要更多计算能力和内存的模型来生成有用的特征。位于顶层的简单模型可以快速适应在线数据中快速的分布变化。这是一种精确度和速度之间的权衡,这种策略通常使用在像定向广告这样需要快速适应数据分布变化的应用中。

核心思想:先使用复杂的基础层(通常带有昂贵的模型)生成良好的(通常是非线性的)特征,再与简单快速的顶层模型组合起来。这样通常能实现模型准确率和速度之间的正确平衡。

与使用非线性分类器相比,k-均值与逻辑回归的堆叠模型更容易训练和存储。表 7-1 详细列出了一些机器学习模型在计算能力和内存方面的训练和预测复杂度。n 表示数据点的数量,d 表示(初始)特征的数量。
在这里插入图片描述
k-均值特征化适合实数型、有界的、能在空间中形成块状密集区域的数值特征。块状区域
可以是任意形状,因为我们可以增加簇的数量来近似它们。(与经典聚类方法不同,我们
不关心如何找出簇的“真实”数目,而只需覆盖它们。)k-均值不能处理欧氏距离无效的特征空间,即分布奇特的数值型变量或分类变量。如果特征集合中包括这种变量,那么有以下几种处理方法。

  • (1) 仅在实数型、有界的数值特征上应用 k-均值特征化。
  • (2) 自定义一种度量方式,用来处理多种数据类型,并使用k-中心点算法。(k-中心点是一 种与 k-均值类似的方法,允许使用任意的度量方式。)
  • (3) 先将分类变量转换为分箱计数统计量,再使用k-均值对其进行特征化。

与处理分类变量和时间序列的技术相结合,k-均值特征化可以用来处理经常出现在像客户
营销和销售分析这种情境下的大批量数据。最后得到的簇可以看作对用户的细分,这在随
后的建模阶段是非常有用的特征。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/620052.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《人人健康》期刊简介及投稿邮箱

《人人健康》期刊简介及投稿邮箱 《人人健康》期刊简介: 主管单位:山西出版传媒集团有限责任公司 主办单位:山西三晋报刊传媒集团有限责任公司 国际刊号ISSN:1004-597X 国内刊号CN:14-1033/R 邮发代号&#xff1…

不甘做小弟,JS时间对象又在搞事情!(上)

关注“大前端私房菜”微信公众号,回复暗号【面试宝典】即可免费领取107页前端面试题。 Date Date 是 js 的一个内置对象,也叫内置构造函数。提供了一堆的方法帮助我们更方便的操作时间 创建时间对象:new Date() 获取时间对象:ne…

NTSC和PAL视频格式的区别

1,历史演变 NTSC早期描述的是525I59.94格式视频,1953年确立标准,美国主导。后来为了方便和PAL制式格式的视频转换,于是将60hz的倍数关系的帧率纳入该系统。 PAL描述的是625I50格式视频,1967年确立标准,欧洲…

完全免费白嫖 GPT-4 的终极方案!

原文链接:https://icloudnative.io/posts/completely-free-to-use-gpt4/ GPT-4 目前是世界上最强的多模态大模型,能力甩 GPT-3.5 好几条街。 大家都希望早日用上 GPT-4,不过目前体验 GPT-4 的渠道非常有限,要么就是开通 ChatGPT …

Java编程笔记31:Record

Java编程笔记31:Record 图源:Fotor懒设计 在日常使用的时候,我们往往需要创建一些“仅用于传输数据的类型”,比如Web编程时候的DTO。 将特殊用途的类型限制为“只读”的一个好处是,这些类型可以安全地在多线程之间共享…

uniapp开发小程序-显示左滑删除效果

一、效果图&#xff1a; 二、代码实现&#xff1a; <template><view class"container"><view class"myorderList"><uni-swipe-action><uni-swipe-action-item class"swipe-action-item" :right-options"option…

【严重】Nacos 集群Raft反序列化漏洞

漏洞描述 Nacos是一个用于动态服务发现和配置以及服务管理的平台。 攻击者可以在Nacos集群处理某些Jraft请求时利用Hessian进行无限制的反序列化&#xff0c;从而造成远程代码执行。 由于Nacos默认监听7848端口处理Raft协议请求&#xff0c;攻击者可能通过向7848端口发送恶意…

[笔记]C++并发编程实战 《四》同步并发操作

文章目录 前言第4章 同步并发操作4.1 等待一个事件或其他条件4.1.1 等待条件达成4.1.2 使用条件变量构建线程安全队列 4.2 使用期望值等待一次性事件4.2.1 后台任务的返回值4.2.2 任务与期望值关联4.2.3 使用(std::)promises4.2.4 将异常存与期望值中4.2.5 多个线程的等待 前言…

【Mysql】InnoDB 中的聚簇索引、二级索引、联合索引

一、聚簇索引 其实之前内容中介绍的 B 树就是聚簇索引。 这种索引不需要我们显示地使用 INDEX 语句去创建&#xff0c;InnoDB 引擎会自动创建。另外&#xff0c;在 InnoDB 引擎中&#xff0c;聚簇索引就是数据的存储方式。 它有 2 个特点&#xff1a; 特点 1 使用记录主键…

【每日挠头算法题(2)】压缩字符串|仅执行一次字符串交换能否使两个字符串相等

文章目录 一、压缩字符串思路 二、仅执行一次字符串交换能否使两个字符串相等思路1&#xff1a;计数法思路2&#xff1a;模拟法 总结 一、压缩字符串 点我直达~ 思路 使用双指针法 大致过程如下&#xff1a; 使用双指针&#xff0c;分别读&#xff08;read&#xff09;&…

mPak的使用文档

mpak介绍 mpak是一种文件格式&#xff0c;同时也是一款虚幻引擎插件&#xff0c;该插件提供了打包、解析和挂载mPak文件的方法&#xff0c;将不同平台的软件包和未编译的资源集成到mPak文件中&#xff0c;该文件具有跨平台兼容性。它支持不同阶段的挂载&#xff0c;例如在编辑…

monaco-editor插件自定义编辑器内容颜色

开始之前先说一下他的自定义内容颜色的api monaco.languages.setMonarchTokensProvider((languageId: string, languageDef: IMonarchLanguage | Thenable<IMonarchLanguage>)) 参数解析&#xff1a;接收两个参数 一个是你要设置的编辑器语言种类&#xff0c;可以是sq…

Ubuntu14.04安装igH EtherCAT Master

一、下载EtherCAT安装包 安装包下载路径&#xff1a;EtherLab EtherCAT Master / Code / [334c34]&#xff0c;打开后点击Download下载 二、安装前置依赖库 最好切换到root用户进行下列步骤 apt-get install autoconf automake libtool net-tools三、编译安装 解压安装包&a…

excel如何折叠展开行列?

Excel可以使用分组功能来实现折叠展开行列的效果&#xff0c;同时可以在单元格内添加号或-号来进行操作。 具体步骤如下&#xff1a; 1. 选中需要进行折叠展开的行或列&#xff0c;右键选择“分组”。 2. 在弹出的“分组”对话框中&#xff0c;选择“行”或“列”&#xff0…

『赠书活动 | 第十一期』清华社赞助 | 《Python系列丛书》

&#x1f497;wei_shuo的个人主页 &#x1f4ab;wei_shuo的学习社区 &#x1f310;Hello World &#xff01; 『赠书活动 &#xff5c; 第十一期』 本期书籍&#xff1a;《Python系列丛书》 公众号赠书&#xff1a;第三期 参与方式&#xff1a;关注公众号&#xff1a;低调而奢…

逻辑回归分类器-创建词向量-情感分析

题目 请使用您今天学习的逻辑回归分类器对下面的聊天机器人数据进行自动分类。&#xff08;3分&#xff09; https://github.com/songys/Chatbot_data&#xff08;ChatbotData.csv文件&#xff09; https://raw.githubusercontent.com/songys/Chatbot_data/master/ChatbotDa…

【职业人生】如何有效的在职场当中避免工作失误和提高个人发展

《左传宣公二年》&#xff1a;“人谁无过&#xff0c;过而能改&#xff0c;善莫大焉。”古往今来&#xff0c;多少人犯过错误。强大如“智绝”的诸葛孔明&#xff0c;也有街亭之失。职场人更是难免会在工作中出现失误。 在职场生涯当中避免不了在工作当中带来的失误&#xff0c…

【Hadoop综合实践】手机卖场大数据综合项目分析

&#x1f680; 本文章实现了基于MapReduce的手机浏览日志分析 &#x1f680; 文章简介&#xff1a;主要包含了数据生成部分&#xff0c;数据处理部分&#xff0c;数据存储部分与数据可视化部分 &#x1f680; 【本文仅供参考】其中需求实现的方式有多种&#xff0c;提供的代码并…

从0到1搞定在线OJ

目录 一、在线OJ的的原理 二、在线OJ的使用规则 三、注意事项 1.关于作弊 2.如何防止作弊 3.输入输出格式 4.换行问题 四、经典在线OJ坑人题目以及博主被坑经历 五、提交不成功及解决方法 六、如何得心应手的拿下OJ系统 七、在线OJ的骗分技巧 在线OJ&#xff08;Onl…

管理项目-查询数据

人事管理项目-查询数据模块 后端实现配置文件实体类Dao层测试前端实现1&#xff0e;创建Dept页面2&#xff0e;修改路由3 测试 后端实现 配置文件 在application.yml文件中配置数据库连接、JPA及端口等信息&#xff0c;代码如下&#xff1a; 实体类 配置完成后建立和表结构…