sklearn基础篇(十)-- 非负矩阵分解与t-SNE

news2025/1/12 3:58:14

1 非负矩阵分解(NFM)

        NMF(Non-negative matrix factorization),即对于任意给定的一个非负矩阵 V \pmb{V} VVV,其能够寻找到一个非负矩阵 W \pmb{W} WWW和一个非负矩阵 H \pmb{H} HHH,满足条件 V = W ∗ H \pmb{V=W*H} V=WHV=WHV=WH,从而将一个非负的矩阵分解为左右两个非负矩阵的乘积。其中, V \pmb{V} VVV矩阵中每一列代表一个观测(observation),每一行代表一个特征(feature); W \pmb{W} WWW矩阵称为基矩阵, H \pmb{H} HHH矩阵称为系数矩阵或权重矩阵。这时用系数矩阵 H \pmb{H} HHH代替原始矩阵,就可以实现对原始矩阵进行降维,得到数据特征的降维矩阵,从而减少存储空间。 过程如下图所示:

        NMF本质上说是一种矩阵分解的方法,它的特点是可以将一个大的非负矩阵分解为两个小的非负矩阵,又因为分解后的矩阵也是非负的,所以也可以继续分解。NMF的应用包括但不限于提取特征、快速识别、基因和语音的检测等等。

        从矩阵空间的角度分析,NMF的意义在于在原空间中寻找一组新基底并将原数据投影到该基底上去。原非负矩阵 V \pmb{V} VVV对应原空间中的原数据,分解之后的两个非负矩阵 W \pmb{W} WWW H \pmb{H} HHH分别对应寻找得到的新基底和投影在新基底上的数值。

        下面用数学语言对NMF进行描述,NMF原理很简单,与SVD将矩阵分解为三个矩阵类似,NMF将矩阵分解为两个小矩阵,比如原始矩阵 V m × n \pmb{V}_{m\times n} VVVm×n分解为 W m × k \pmb{W}_{m\times k} WWWm×k H k × n \pmb{H}_{k\times n} HHHk×n的乘积,即:

V m × n ≈ W m × k H k × n (1-1) \pmb{V}_{m\times n}\approx \pmb{W}_{m\times k}\pmb{H}_{k\times n}\tag{1-1} VVVm×nWWWm×kHHHk×n(1-1)

        这里,要求 A , W , H A,W,H A,W,H中的元素都非负,而参数估计也很简单,最小化如下的平方损失即可:

L ( V , W , H ) = 1 2 ∑ i = 1 m ∑ j = 1 n ( V i j − ( W H ) i j ) 2 = 1 2 ∑ i = 1 m ∑ j = 1 n ( V i j − ∑ l = 1 k W i l H l j ) 2 (1-2) L(V,W,H)=\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^n(V_{ij}-(WH)_{ij})^2=\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^n(V_{ij}-\sum_{l=1}^kW_{il}H_{lj})^2\tag{1-2} L(V,W,H)=21i=1mj=1n(Vij(WH)ij)2=21i=1mj=1n(Vijl=1kWilHlj)2(1-2)

        所以:

W ∗ , H ∗ = a r g min ⁡ W , H L ( V , W , H ) (1-3) W^*,H^*=arg\min_{W,H}L(V,W,H)\tag{1-3} W,H=argW,HminL(V,W,H)(1-3)

        对于参数估计,采用梯度下降即可,下面推导一下:

∂ L ∂ W i k = ∑ j ( V i j − ( W H ) i j ) ⋅ ∂ ( W H ) i j ∂ W i k = ∑ j ( V i j − ( W H ) i j ) ⋅ ( − H k j ) = − ∑ j V i j H k j + ∑ j ( W H ) i j H k j = ( W H H T ) i k − ( V H T ) i k (1-4) \begin{aligned} \frac{\partial L}{\partial W_{ik}}&=\sum_j(V_{ij}-(WH)_{ij})\cdot \frac{\partial (WH)_{ij}}{\partial W_{ik}}\\ &=\sum_j(V_{ij}-(WH)_{ij})\cdot (-H_{kj})\\ &=-\sum_j V_{ij}H_{kj}+\sum_j(WH)_{ij}H_{kj}\\ &=(WHH^T)_{ik}-(VH^T)_{ik} \end{aligned}\tag{1-4} WikL=j(Vij(WH)ij)Wik(WH)ij=j(Vij(WH)ij)(Hkj)=jVijHkj+j(WH)ijHkj=(WHHT)ik(VHT)ik(1-4)

        类似地:

∂ L ∂ H k j = ( W T W H ) k j − ( W T V ) k j (1-5) \frac{\partial L}{\partial H_{kj}}=(W^TWH)_{kj}-(W^TV)_{kj}\tag{1-5} HkjL=(WTWH)kj(WTV)kj(1-5)

        所以,梯度下降的更新公式可以表示如下:

W i k ← W i k + α 1 [ ( V H T ) i k − ( W H H T ) i k ] H k j ← H k j + α 2 [ ( W T V ) k j − ( W T W H ) k j ] (1-6) W_{ik}\leftarrow W_{ik}+\alpha_1[(VH^T)_{ik}-(WHH^T)_{ik}]\\ H_{kj}\leftarrow H_{kj}+\alpha_2[(W^TV)_{kj}-(W^TWH)_{kj}]\tag{1-6} WikWik+α1[(VHT)ik(WHHT)ik]HkjHkj+α2[(WTV)kj(WTWH)kj](1-6)

        这里, α 1 > 0 , α 2 > 0 \alpha_1>0,\alpha_2>0 α1>0,α2>0为学习率,如果我们巧妙的设置:

α 1 = W i k ( W H H T ) i k α 2 = H k j ( W T W H ) k j (1-7) \alpha_1=\frac{W_{ik}}{(WHH^T)_{ik}}\\ \alpha_2=\frac{H_{kj}}{(W^TWH)_{kj}}\tag{1-7} α1=(WHHT)ikWikα2=(WTWH)kjHkj(1-7)

        那么,迭代公式为:

W i k ← W i k ⋅ ( V H T ) i k ( W H H T ) i k H k j ← H k j ⋅ ( W T V ) k j ( W T W H ) k j (1-8) W_{ik}\leftarrow W_{ik}\cdot\frac{(VH^T)_{ik}}{(WHH^T)_{ik}}\\ H_{kj}\leftarrow H_{kj}\cdot\frac{(W^TV)_{kj}}{(W^TWH)_{kj}}\tag{1-8} WikWik(WHHT)ik(VHT)ikHkjHkj(WTWH)kj(WTV)kj(1-8)

        可以发现该迭代公式也很好的满足了我们的约束条件, W , H \pmb{W},\pmb{H} WWW,HHH在迭代过程中始终非负。

        上面采用的是迭代法,一步步逼近最终的结果,当计算得到的两个矩阵 W \pmb{W} WWW H \pmb{H} HHH收敛时,就说明分解成功。需要注意的是,原矩阵和分解之后两个矩阵的乘积并不要求完全相等,可以存在一定程度上的误差。如果要在计算机中实现NMF,则可以根据如下图所示的步骤进行

NMF算法步骤

         详细求解过程可以参考:非负矩阵分解(NMF)迭代公式推导证明

1.1 将 NMF 应用于人脸图像

        与使用PCA不同,我们需要保证数据是正的。这说明数据相对于原点(0, 0)的位置实际上对NMF很重要。因此,你可以将提取出来的非负分量看作是从(0, 0)到数据的方向。下面的例子给出了NMF 在二维玩具数据上的结果:


图1 两个分量的非负矩阵分解(左)和一个分量的非负矩阵分解(右)找到的分量

         首先,我们来观察分量个数如何影响NMF 重建数据的好坏:

from sklearn.datasets import fetch_lfw_people
from sklearn.model_selection import train_test_split

# 导入人脸图像
people = fetch_lfw_people(min_faces_per_person=20, resize=0.7)
image_shape = people.images[0].shape

# 每类最多取50张
mask = np.zeros(people.target.shape, dtype=np.bool)
for target in np.unique(people.target):
    mask[np.where(people.target == target)[0][:50]] = 1

X_people = people.data[mask]
y_people = people.target[mask]

# 将灰度值缩放到0到1之间,而不是在0到255之间,以得到更好的数据稳定性
X_people = X_people / 255

# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X_people, y_people, stratify=y_people, random_state=0)

mglearn.plots.plot_nmf_faces(X_train, X_test, image_shape)
图2 利用越来越多分量的NMF重建三张人脸图像

         反向变换的数据质量与使用PCA时类似,但要稍差一些。这是符合预期的,因为PCA找到的是重建的最佳方向。NMF通常并不用于对数据进行重建或编码,而是用于在数据中寻找有趣的模式。

         我们尝试仅提取一部分分量(比如15个),初步观察一下数据。

from sklearn.decomposition import NMF
nmf = NMF(n_components=15, random_state=0)
nmf.fit(X_train)
X_train_nmf = nmf.transform(X_train)
X_test_nmf = nmf.transform(X_test)

fig, axes = plt.subplots(3, 5, figsize=(15, 12),
                         subplot_kw={'xticks': (), 'yticks': ()})
for i, (component, ax) in enumerate(zip(nmf.components_, axes.ravel())):
    ax.imshow(component.reshape(image_shape))
    ax.set_title("{}. component".format(i))
图3 使用15个分量的NMF在人脸数据集上找到的分量

         你可以清楚地看到,分量3(component 3)显示了稍微向右转动的人脸,而分量7(component 7)则显示了稍微向左转动的人脸。我们来看一下这两个分量特别大的那些图像,

compn = 3
# 第3个分量的系数较大的人脸
inds = np.argsort(X_train_nmf[:, compn])[::-1]
fig, axes = plt.subplots(2, 5, figsize=(15, 8),
                         subplot_kw={'xticks': (), 'yticks': ()})
fig.suptitle("Large component 3")
for i, (ind, ax) in enumerate(zip(inds, axes.ravel())):
    ax.imshow(X_train[ind].reshape(image_shape))
图4 分量3系数较大的人脸
compn = 7
# 第7个分量的系数较大的人脸
inds = np.argsort(X_train_nmf[:, compn])[::-1]
fig.suptitle("Large component 7")
fig, axes = plt.subplots(2, 5, figsize=(15, 8),
                         subplot_kw={'xticks': (), 'yticks': ()})
for i, (ind, ax) in enumerate(zip(inds, axes.ravel())):
    ax.imshow(X_train[ind].reshape(image_shape))
图5 分量7系数较大的人脸

         正如所料,分量3系数较大的人脸都是向右看的人脸(图4),而分量7系数较大的人脸都向左看(图5)。如前所述,提取这样的模式最适合于具有叠加结构的数据,包括音频、基因表达和文本数据。我们通过一个模拟数据的例子来看一下这种用法。

1.2 盲源信号分离

         假设我们对一个信号感兴趣,它是三个不同信号源合成的:

S = mglearn.datasets.make_signals()
plt.figure(figsize=(6, 1))
plt.plot(S, '-')
plt.xlabel('Time')
plt.ylabel('Signal')
图6 原始信号源

         不幸的是,我们无法观测到原始信号,只能观测到三个信号的叠加混合。我们想要将混合信号分解为原始分量。假设我们有许多种不同的方法来观测混合信号(比如有100台测量装置),每种方法都为我们提供了一系列测量结果。

# 将数据混合成100维的状态
A = np.random.RandomState(0).uniform(size=(100, 3))
X = np.dot(S, A.T)
print("Shape of measurements: {}".format(X.shape))      # Shape of measurements: (2000, 100)

         我们可以用NMF和PCA来还原这三个信号:

from sklearn.decomposition import PCA 
pca = PCA(n_components=3)
H = pca.fit_transform(X)

         给出了NMF和PCA发现的信号活动:

models = [X, S, S_, H]
names = ['Observations (first three measurements)',
         'True sources',
         'NMF recovered signals',
         'PCA recovered signals']

fig, axes = plt.subplots(4, figsize=(8, 4), gridspec_kw={'hspace': .5}, subplot_kw={'xticks': (), 'yticks': ()})

for model, name, ax in zip(models, names, axes):
    ax.set_title(name)
    ax.plot(model[:, :3], '-')
图7 利用NMF和PCA还原混合信号源

         图中包含来自X的100次测量中的3次,用于参考。可以看到,NMF在发现原始信号源时得到了不错的结果,而PCA则失败了,仅使用第一个成分来解释数据中的大部分变化。要记住,NMF生成的分量是没有顺序的。在这个例子中,NMF分量的顺序与原始信号完全相同(参见三条曲线的颜色),但这纯属偶然。

2 用t-SNE进行流形学习

         流形学习算法主要用于可视化,因此很少用来生成两个以上的新特征。其中一些算法(包括t-SNE)计算训练数据的一种新表示,但不允许变换新数据。这意味着这些算法不能用于测试集:更确切地说,它们只能变换用于训练的数据。流形学习对探索性数据分析是很有用的,但如果最终目标是监督学习的话,则很少使用。t-SNE背后的思想是找到数据的一个二维表示,尽可能地保持数据点之间的距离。t-SNE首先给出每个数据点的随机二维表示,然后尝试让在原始特征空间中距离较近的点更加靠近,原始特征空间中相距较远的点更加远离。t-SNE重点关注距离较近的点,而不是保持距离较远的点之间的距离。换句话说,它试图保存那些表示哪些点比较靠近的信息。

         t-SNE全称为 t-distributed Stochastic Neighbor Embedding,翻译为 t分布-随机邻近嵌入。首先,t-分布是关于样本(而非总体)的t 变换值的分布,它是对u 变换变量值的标准正态分布的估计分布,是一位学生首先提出的,所以 t-分布全称:学生t-分布。其次,t-SNE本质是一种嵌入模型,能够将高维空间中的数据映射到低维空间中,并保留数据集的局部特性。t-SNE 可以算是目前效果很好的数据降维和可视化方法之一。缺点主要是占用内存较多、运行时间长。

         t-SNE变换后,如果在低维空间中具有可分性,则数据是可分的;如果在低维空间中不可分,则可能是因为数据集本身不可分,或者数据集中的数据不适合投影到低维空间。该算法在论文中非常常见,主要用于高维数据的降维和可视化。Visualizing Data using t-SNE,2008年发表在Journal of Machine Learning Research。

         我们将对scikit-learn包含的一个手写数字数据集2应用t-SNE流形学习算法。在这个数据集中,每个数据点都是0到9之间手写数字的一张8×8灰度图像。

from sklearn.datasets import load_digits
digits = load_digits()
print("手写数字数据集的形状= {}".format(digits.data.shape))  # (1797, 64)
print("手写数字数据集中图片的形状= {}".format(digits.images.shape))  # (1797, 8, 8)

fig, axes = plt.subplots(2, 5, figsize=(10, 5),subplot_kw={'xticks':(), 'yticks': ()})
for ax, img in zip(axes.ravel(), digits.images):
    ax.imshow(img)
图8 digits数据集的示例图像

         我们用PCA将降到二维的数据可视化。我们对前两个主成分作图,并按类别对数据点着色。

# 构建一个 PCA 模型
pca = PCA(n_components=2)
pca.fit(digits.data)
# 将 digits 数据变换到前两个主成分的方向上
digits_pca = pca.transform(digits.data)
colors = ["#476A2A", "#7851B8", "#BD3430", "#4A2D4E", "#875525",
          "#A83683", "#4E655E", "#853541", "#3A3120", "#535D8E"]
plt.figure(figsize=(10, 10))
plt.xlim(digits_pca[:, 0].min(), digits_pca[:, 0].max())
plt.ylim(digits_pca[:, 1].min(), digits_pca[:, 1].max())
for i in range(len(digits.data)):
    # 将数据绘制成文本图(代替散点图)
    plt.text(digits_pca[i, 0], digits_pca[i, 1], str(digits.target[i]),
             color = colors[digits.target[i]],
             fontdict={'weight': 'bold', 'size': 9})
plt.xlabel("第一个主成分")
plt.ylabel("第二个主成分")
图9 利用前两个主成分绘制digits 数据集的散点图

         实际上,这里我们用每个类别对应的数字作为符号来显示每个类别的位置。利用前两个主成分可以将数字0、6和4相对较好地分开,尽管仍有重叠。大部分其他数字都大量重叠在一起。

         我们将t-SNE应用于同一个数据集,并对结果进行比较。由于t-SNE不支持变换新数据,所以TSNE类没有transform方法。我们可以调用fit_transform方法来代替,它会构建模型并立刻返回变换后的数据:

from sklearn.manifold import TSNE
tsne = TSNE(random_state=42)
# 使用 fit_transform() 代替 fit(), 因为 TSNE 没有 transform()
digits_tsne = tsne.fit_transform(digits.data)
plt.figure(figsize=(10, 10))
plt.xlim(digits_tsne[:, 0].min(), digits_tsne[:, 0].max() + 1)
plt.ylim(digits_tsne[:, 1].min(), digits_tsne[:, 1].max() + 1)
for i in range(len(digits.data)):
    # 将数据绘制成文本图(代替散点图)
    plt.text(digits_tsne[i, 0], digits_tsne[i, 1], str(digits.target[i]),
             color = colors[digits.target[i]],
             fontdict={'weight': 'bold', 'size': 9})
plt.xlabel("t-SNE feature 0")
plt.ylabel("t-SNE feature 1")
图10 利用t-SNE找到的两个分量绘制digits数据集的散点图

         t-SNE的结果非常棒。所有类别都被明确分开。数字1和9被分成几块,但大多数类别都形成一个密集的组。要记住,这种方法并不知道类别标签:它完全是无监督的。但它能够找到数据的一种二维表示,仅根据原始空间中数据点之间的靠近程度就能够将各个类别明确分开。


参考

  • Nimfa is a Python library for nonnegative matrix factorization:http://nimfa.biolab.si/
  • Non-negative matrix factorization:https://en.wikipedia.org/wiki/Non-negative_matrix_factorization
  • NMF 非负矩阵分解 – 原理与应用:https://blog.csdn.net/qq_26225295/article/details/51211529
  • 非负矩阵分解NMF:https://blog.csdn.net/pipisorry/article/details/52098864
  • 非负矩阵分解(NMF)迭代公式推导证明:https://zhuanlan.zhihu.com/p/340774022
  • 非负矩阵分解(NMF)浅析:https://cloud.tencent.com/developer/article/2104422
  • t-SNE:最好的降维方法之一:https://zhuanlan.zhihu.com/p/64664346

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/94592.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

物联网架构实例—解决Linux(Ubuntu)服务器最大TCP连接数限制

1.前言: 在对物联网网关进行压测的时候,发现在腾讯云部署网关程序,设备接入数量只能达到4000多个长连接,之后就再也无法接入终端了。 之前在阿里云部署的时候明明可以到达2万左右,而且腾讯云的这个服务器比阿里云的硬…

蓝桥杯嵌入式综合实验真题-联网电压测量系统设计与实现

目录 实验要求: 实验思路: 核心代码: (1)变量声明 (2)函数声明 (3)main主函数 (4)按键(长按/短按) (5&…

K8s——Service、代理模式演示(二)

Service 演示 SVC 创建svc-deployment.yaml apiVersion: apps/v1 kind: Deployment metadata:name: myapp-deploynamespace: default spec:replicas: 3selector:matchLabels:app: myapprelease: stabeltemplate:metadata:labels:app: myapprelease: stabelenv: testspec: c…

学习UI设计有哪些figma插件

自2016年推出以来,Figma已发展成为市场领先者UI设计工具之一。 因为它不仅简单易用,功能优秀,而且基于云服务,可以实时编辑,节省大量手动下载或复制文件的时间。不仅如此,Figma还提供合作功能,…

一文读懂PFMEA(过程失效模式及后果分析)

PFMEA是过程失效模式及后果分析(Process Failure Mode andEffects Analysis)的英文简称,是由负责制造/装配的工程师/小组主要采用的一种分析技术,用以最大限度地保证各种潜在的失效模式及其相关的起因/机理已得到充分的考虑和论述。 名词解释&#xff1a…

springboot介绍

笔记来源于 动力节点springboot Javaconfig xml方式 在创建模块时&#xff0c;idea2022新版选择internal即可&#xff1a; pom.xml文件 <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xs…

圆顶光源特点及应用——塑料包装袋、PCB板检测

照明系统是机器视觉系统较为关键的部分之一&#xff0c;机器视觉光源直接影响到图像的质量&#xff0c;进而影响到系统的性能。其重要性无论如何强调都是不过分的。好的打光设计能够使我们得到一幅好的图象&#xff0c;从而改善整个整个系统的分辨率&#xff0c;简化软件的运算…

Java JNA 调用DLL(动态连接库) 回调函数

首先准备好动态链接库dll 参考连接 visual studio 2017 创建dll文件并使用https://blog.csdn.net/miss_na/article/details/113524280 Visual Studio 2017 动态链接库(.dll)生成与使用的简明教程https://blog.csdn.net/Hide_on_Stream/article/details/109172054 jni之jni与…

【记录】U盘安装Ubuntu20.04系统

之前电脑安装的Centos7系统&#xff0c;但是在启动过程中遇到了文件异常&#xff0c;就开不了机了&#xff0c;另外貌似Centos7已经停止维护了&#xff0c;想了下&#xff0c;果断不要数据了&#xff0c;直接重装系统吧&#xff0c;这次选用的是Ubuntu 20.04【ps: 没有选择最新…

「含元量」激增,这届世界杯的看点不止足球

文|智能相对论 作者|青月 半决赛结束&#xff0c;卡塔尔世界杯已经正式进入倒计时阶段。 这届世界杯诞生了不少精彩瞬间&#xff0c;在小组赛中&#xff0c;日本、韩国、沙特接连打败西班牙、葡萄牙、阿根廷等传统强队&#xff0c;摩洛哥也代表非洲球队首次挺进四强&#xf…

v8垃圾回收

文章目录内存的生命周期v8垃圾回收算法新生代Scavenge图例老生代Mark-SweepMark-Compact图例v8垃圾回收的弊端v8垃圾回收优化内存的生命周期 内存的生命周期可以分为三个阶段&#xff1a; 内存分配&#xff1a;按需分配内存内存食用&#xff1a;读写已经分配的内存内存释放&a…

Linux 管理联网 配置网络的四种方法 配置临时连接( ip 命令)

配置网络 # 网络接口是指网络中的计算机或网络设备与其他设备实现通讯的进出口。这里,主要是 指计算机的网络接口即 网卡设备 # 网络接口 -- 网卡 的命名 &#xff1a; 从RHEL7开始引入了一种新的“一致网络设备命名”的方式为网络接口命名,该…

【Java笔记】 深入理解序列化和反序列化

深入理解序列化和反序列化 文章目录深入理解序列化和反序列化1.是什么2.为什么3.怎么做3.1 实现Serializable接口3.2 实现Externalizable接口3.3 注意知识点3.4 serialVersionUID的作用4 扩展1.是什么 序列化&#xff1a;就是讲对象转化成字节序列的过程。 反序列化&#xff…

C++开发,这些GUI库一定不要错过

程序员宝藏库&#xff1a;https://gitee.com/sharetech_lee/CS-Books-Store 如果问Python这类集成度非常高的编程语言GUI开发用什么库&#xff0c;可以列举出很多不错的第三方库。 但是&#xff0c;如果这个问题放在C这种基础的编程语言上&#xff0c;很多同学估计一时间都无从…

用Gurobi+python求解设施选址问题(facility location)

参考&#xff1a;Gurobi 官方资源 设施选址&#xff08;Facility Location&#xff09; 1.背景介绍 设施选址问题在许多工业领域如物流&#xff0c;通信等都有应用&#xff0c;在本案例中展示如何解决设施选址问题&#xff0c;决策出仓库的数量和地点&#xff0c;为一些超市…

Crash Consistency on File Systems: 文件系统一致性保证 (1) Journaling File System

文件系统是操作系统中管理用户数据的重要模块。其中一项重要的任务就是确保用户数据的在系统突然崩溃之后&#xff0c;系统能够恢复出完整、一致的用户数据。本文将会分析两种流行的文件系统&#xff0c;Journaling File System 和 Log-structured File System是如何确保数据的…

dataFactory连接mysql详细配置教程

场景&#xff1a;最近项目提出机构用户中其中一个部门下用户人数有20万&#xff0c;加载的时候十分缓慢&#xff0c;本地想重现的一下&#xff0c;这就需要在本地表中生成>20万的数据&#xff0c;搜索了网上的教程写的都是很粗略。 目录 dataFactory连接mysql配置 安装包下…

第二证券|“20cm”涨停!盘中暴涨110%,又有港股暴力拉升

A股商场今日上午窄幅动摇&#xff0c;电子等板块领涨。北向资金半响净买入额到达26.10亿元。 港股商场今日上午动摇也较为温和。不过&#xff0c;仍有个股剧烈动摇。比如浦江世界上午暴升&#xff0c;盘中涨幅一度超过110%。 A股窄幅动摇 电子板块领涨 今日上午A股商场全体体…

STL六大组件之算法

文章目录56、STL六大组件之遍历算法57、STL六大组件之查找算法158、STL六大组件之查找算法259、STL六大组件之统计算法60、STL六大组件之合并算法61、随机数&#xff08;rand&#xff09;和随机数种子&#xff08;srand&#xff09;的理解62、STL六大组件之随机算法(洗牌算法)6…

javaweb笔记

javaweb数据库jdbcmaven数据库 1.chart定长 2.分组查询:where>聚合函数>having 3.分页查询: select 字段列表 from limit 起始索引&#xff0c; 查询条目数 计算公式: 起始索引&#xff08;当前页码-1&#xff09;每页显示的条数 不同数据库分页查询不一样 4.like模糊查…