无监督学习
顾名思义,它与监督式机器学习方法或算法相反,这意味着在无监督的机器学习算法中,我们没有任何监督者可以提供任何类型的指导。在没有监督学习算法那样的自由的情况下,无监督学习算法非常方便,因为在这种情况下我们没有预先标签训练数据,而我们想从输入数据中提取有用的模式。
例如,可以理解如下:
假设我们有-
-
x-输入变量,那么将没有相应的输出变量,并且算法需要在数据中发现有趣的模式以供学习。
无监督机器学习算法的示例包括 K-means聚类,K-最近邻居等。
基于ML任务,无监督学习算法可以分为以下几大类-
- 聚类
- 协会
- 降维
聚类
聚类 methods are one of the most useful unsupervised ML methods. These algorithms used to find similarity as well as relationship patterns among data samples and then cluster those samples into groups having similarity based on features. The real-world example of clustering is to group the customers by their purchasing behavior.
协会
Another useful unsupervised ML method is 协会 which is used to analyze large dataset to find patterns which further represents the interesting relationships between various items. It is also termed as 协会 Rule Mining or Market basket analysis which is mainly used to analyze customer shopping patterns.
降维
此无监督的ML方法用于通过选择一组主要特征或代表性特征来减少每个数据样本的特征变量的数量。这里出现的一个问题是,为什么我们需要减小尺寸?背后的原因是特征空间复杂性的问题,当我们开始分析并从数据样本中提取数百万个特征时就会出现。这个问题通常指的是"维数的诅咒"。 PCA(主成分分析),K最近邻和判别分析是用于此目的的一些流行算法。
异常检测
这种无监督的ML方法用于找出通常不会发生的罕见事件或观测的发生。通过使用所学的知识,异常检测方法将能够区分异常或正常数据点。诸如聚类,KNN之类的一些无监督算法可以根据数据及其特征检测异常。
Python机器学习 中的 Unsupervised Lea - 无涯教程网无涯教程网提供无监督学习顾名思义,它与监督式机器学习方法或算法相反,这意味着在无监督的机器学习算...https://www.learnfk.com/python-machine-learning/machine-learning-with-python-unsupervised-learning.html