【机器学习入门】18种常见的机器学习算法数学公式及解析

news2025/1/13 17:26:18

机器学习算法基础原理:

https://codeknight.blog.csdn.net/article/details/135632808icon-default.png?t=N7T8https://codeknight.blog.csdn.net/article/details/135632808

https://codeknight.blog.csdn.net/article/details/135639843icon-default.png?t=N7T8https://codeknight.blog.csdn.net/article/details/135639843

机器学习算法模型应用:

(3)【Python数据分析进阶】Machine-Learning模型与算法应用-线性回归与逻辑回归-CSDN博客文章浏览阅读1.5k次,点赞21次,收藏18次。sklearn,全称scikit-learn,是一个基于Python的开源机器学习工具包。它提供了各种分类、回归和聚类算法,包括但不限于支持向量机、随机森林、梯度提升、k均值和DBSCAN等。此外,它还包含了许多常用的机器学习算法、预处理技术、模型选择和评估工具等,可以方便地进行数据挖掘。这个库通过集成NumPy, SciPy和Matplotlib等Python数值计算的库实现了高效的算法应用。可以说,sklearn是机器学习中一个非常常用且功能强大的Python第三方模块。https://blog.csdn.net/qq_51701007/article/details/135693621?spm=1001.2014.3001.5501

目录

1、一元一次线性回归公式与解析

2、多元一次线性回归公式与解析

3、多项式线性回归公式与解析

4、VIF(Variance Inflation Factor,方差膨胀因子)公式与解析

5、岭回归(Ridge Regression)公式与解析

6、Lasso回归(Least Absolute Shrinkage and Selection Operator)公式与解析

7、逻辑回归(Logistic Regression)公式与解释

8、决策树算法公式与解析

9、随机森林算法公式与解析

​​​​10、Adaboost(自适应增强)算法公式与解析

11、XGBoost算法公式与解析

12、Gradient Boosting算法公式与解析

13、KNN算法的公式与解析

14、支持向量机(SVM)算法公式与解析

15、贝叶斯算法公式与解析

16、K-Means聚类算法公式与解析

16、层次聚类算法公式与解析

17、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法公式与解析

18、PCA(Principal Component Analysis)算法公式与解析


1、一元一次线性回归公式与解析

                y = ax + b,其中a为斜率,b为截距。

解析:

  1. 首先,我们需要收集数据点(x, y)。
  2. 然后,计算所有数据点的x和y的平均值。
  3. 接下来,计算斜率a,即数据点之间的x差的平均值与y差的平均值之比。
  4. 最后,计算截距b,即y轴上的截距,即y轴上所有数据点的平均值减去斜率a乘以x轴上所有数据点的平均值。

2、多元一次线性回归公式与解析

3、多项式线性回归公式与解析

4、VIF(Variance Inflation Factor,方差膨胀因子)公式与解析

VIF(Variance Inflation Factor,方差膨胀因子)是一种衡量多重共线性的统计指标。在回归分析中,如果一个自变量与多个其他自变量高度相关,那么这个自变量就存在多重共线性问题。

VIF的计算公式为:

VIF = 1 / (1 - R²)

其中,R²表示自变量与其他自变量的相关系数平方和。

5、岭回归(Ridge Regression)公式与解析

岭回归(Ridge Regression)是一种线性回归的改进方法,它通过在损失函数中添加一个L2正则项(权重系数的平方和)来防止过拟合。岭回归的公式如下:

6、Lasso回归(Least Absolute Shrinkage and Selection Operator)公式与解析

Lasso回归(Least Absolute Shrinkage and Selection Operator)是一种线性回归的正则化方法,它通过在损失函数中添加一个L1正则项(权重系数的绝对值之和)来控制模型的复杂度。Lasso回归的公式如下:

7、逻辑回归(Logistic Regression)公式与解释

逻辑回归(Logistic Regression)是一种分类算法,主要用于解决二分类问题。其公式为:

8、决策树算法公式与解析

是一种集成学习方法,它通过构建多个决策树并将它们的预测结果进行投票来得到最终的预测结果。随机森林算法的主要公式如下:

9、随机森林算法公式与解析

是一种集成学习方法,它通过构建多个决策树并将它们的预测结果进行投票来得到最终的预测结果。随机森林算法的主要公式如下:

10、Adaboost(自适应增强)算法公式与解析

即自适应增强算法,是一种集成学习的算法。其核心思想是通过对训练数据集进行重新加权,使得前一个基础分类器分错的样本在后一个基础分类器中得到更多的关注,同时减小前一个分类器分对的样本在后一个分类器中的关注。此外,该算法会赋予每个弱分类器一个权重系数,这个权重系数体现了这个弱分类器的性能好坏。

11、XGBoost算法公式与解析

12、Gradient Boosting算法公式与解析

13、KNN算法的公式与解析

14、支持向量机(SVM)算法公式与解析

支持向量机(SVM)算法的核心思想是找到一个超平面,使得两个类别之间的间隔最大化。这个超平面被称为最优分割超平面。支持向量机算法的公式如下:

15、贝叶斯算法公式与解析

是一种基于概率的分类算法,它通过计算先验概率和后验概率来进行分类。贝叶斯公式是该算法的核心公式,其表达式如下:

16、K-Means聚类算法公式与解析

是一种无监督学习方法,其基本思想是通过迭代计算,将数据集划分为K个簇。算法的主要步骤如下:

  1. 初始化:选择K个初始质心(可以随机选择数据集中的数据点作为初始质心)。
  2. 分配:将每个数据点分配到距离其最近的质心所在的簇。
  3. 更新:重新计算每个簇的质心,即簇内所有数据点的均值。
  4. 重复步骤2和3,直到质心不再发生变化或达到最大迭代次数。

K-Means算法的LaTeX公式表示如下:

16、层次聚类算法公式与解析

主要包括两种:凝聚式(Agglomerative)和分裂式(Divisive)。这里以凝聚式为例,介绍其公式及注解。

  1. 最小距离法(Single-linkage):计算簇内各点之间的距离,取最小值作为簇间的距离。

  2. 最大距离法(Complete-linkage):计算簇内各点之间的距离,取最大值作为簇间的距离。

  3. 平均距离法(Average-linkage):计算簇内各点之间的距离,取平均值作为簇间的距离。

  4. 中心距离法(Ward's method):计算簇内各点之间的距离,加上簇间的距离的平方和的倒数作为簇间的距离。

层次聚类算法的公式表示如下:

17、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法公式与解析

是一种基于密度的聚类算法,它可以找到任意形状的簇,并且能够识别噪声点。DBSCAN算法的主要公式如下:

 18、PCA(Principal Component Analysis)算法公式与解析

是一种常用的无监督学习算法,用于精简高维数据。它的主要思想是通过线性变换将原始数据投影到新的坐标系中,使得新坐标系的基向量尽可能接近于原始数据的协方差矩阵的特征向量。

PCA算法的基本步骤如下:

  1. 计算原始数据的均值和协方差矩阵。
  2. 对协方差矩阵进行特征值分解,得到特征值和特征向量。
  3. 选择前k个最大的特征值对应的特征向量,构成一个投影矩阵。
  4. 将原始数据乘以投影矩阵,得到降维后的数据。

以下是PCA算法公式及注解:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1417212.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android 性能优化总结:包体积优化

前言 随着开发不断迭代,App体积越来越大,包大小的增大也会给我们应用带来其他的影响 比如 下载率影响 过大的包体积会影响下载转化率,根据Google Play Store包体积和转化率分析报告显示,平均每增加1M,转化率下降0.2%左…

【MATLAB第95期】#源码分享 | 基于MATLAB的卷积神经网络CNN图像分类源代码分享(含两个案例)

【MATLAB第95期】#源码分享 | 基于MATLAB的卷积神经网络CNN图像分类源代码分享(含两个案例) 一、案例一 1、背景介绍 目的:训练和测试卷积神经网络,以检测钻头三种类型。 深度学习(DL)是机器学习的一个子…

Element table组件内容\n换行

漂亮的页面总是让人心旷神怡,层次清晰的页面让用户操作起来也是易于上手及展示。 如下的页面展示就是非常low的:用户根本阅读其中的数据。 在这个页面,根据用户填写过程生成多次填写记录,如果不进行层次性的展示,数据…

【C语言】学生管理系统

学生管理系统是一个用于管理学生信息、成绩、课程等数据的软件系统。在本文中,我们将使用C语言来实现一个简易的学生管理系统,包括学生信息的录入、显示、查询等功能。我们将使用文件来存储学生信息,以便实现持久化存储。 该学生管理…

JAVA 学习 面试(十一)常见设计模式

设计模式 ## 1、创建型模式 对象实例化的模式,创建型模式用于解耦对象的实例化过程。 单例模式:某个类智能有一个实例,提供一个全局的访问点。 工厂模式:一个工厂类根据传入的参量决定创建出哪一种产品类的实例。 抽象工厂模式&a…

Android学习之路(25) Theme和Style

1、官方详细解读 样式和主题背景 | Android 开发者 | Android Developers 2、应用场景 类似web设计中css样式。将应用设计的细节与界面的结构和行为分开。 样式style :应用于 单个 View 的外观。样式可以指定字体颜色、字号、背景颜色等属性 主题theme&…

OpenHarmony—不支持解构赋值

规则:arkts-no-destruct-assignment 级别:错误 ArkTS不支持解构赋值。可使用其他替代方法,例如,使用临时变量。 TypeScript let [one, two] [1, 2]; // 此处需要分号 [one, two] [two, one];let head, tail [head, ...tail]…

WordPress如何使用SQL实现一键关闭/开启评论功能(已有评论)

WordPress本人就自带评论功能,不过由于种种原因,有些站长不想开启评论功能,那么应该怎么实现一键关闭评论功能或开启评论功能呢?或者针对已有评论功能的文章进行一键关闭或开启评论功能应该怎么操作? 如果你使用的Wor…

每日一道面试题:Java中序列化与反序列化

写在开头 哈喽大家好,在高铁上码字的感觉是真不爽啊,小桌板又拥挤,旁边的小朋友也比较的吵闹,影响思绪,但这丝毫不影响咱学习的劲头!哈哈哈,在这喧哗的车厢中,思考着这样的一个问题…

Spring - 基本用法参考

Spring 官方文档 Spring容器启动流程(源码解读) BeanFactoryPostProcessor vs BeanPostProcessor vs BeanDefinitionRegistryPostProcessor: From java doc: BeanFactoryPostProcessor may interact with and modify bean defin…

MyBatis 如何整合 Druid 连接池?

Mybatis 如何整合 Druid 数据连接池呢&#xff1f;首先打开创建的 Maven 工程&#xff0c;找到 pom.xml 文件&#xff0c;添加 Druid 依赖。 <!--druid连接池--> <dependency><groupId>com.alibaba</groupId><artifactId>druid</artifactId&…

Mac思维导图软件XMind for mac 中文版

XMind for Mac是一款高效、易于使用的思维导图软件&#xff0c;能够帮助用户更好地组织思维和创意。无论您需要制作工作报告、演讲稿还是学习笔记&#xff0c;XMind都能够为您提供卓越的支持和帮助。 软件下载&#xff1a;XMind for mac 中文版下载 XMind for Mac具有直观的界面…

精通Python第18篇—数据之美:Pyecharts水球图绘制与交互的完整教程

Pyecharts水球图绘制与交互的完整教程 在数据可视化领域&#xff0c;Pyecharts是一个强大而灵活的工具&#xff0c;它能够以美观的方式呈现各种图表&#xff0c;其中之一就是炫酷水球图。水球图能够生动地展示数据的比例关系&#xff0c;给用户一种直观的感受。本文将深入介绍…

爬虫基础-计算机网络协议

一个数据的传输 这些设备的数据转发是通过协议来完成的&#xff0c;整个互联网可以说是完全由网络协议来维持的 不同的协议分工不同&#xff0c;比如ip协议确保了ip寻址&#xff0c;tcp协议确保了数据完整性 IP地址和URL ip地址 整个网络传输可以比作快递&#xff0c;数据就…

C51 单片机学习(一):基础外设

参考 51单片机入门教程 1. 单片机简介 1.1 定义 单片机&#xff08;Micro Controller Unit&#xff0c;简称 MCU&#xff09; 内部集成了 CPU、RAM、ROM、定时器、中断系统、通讯接口等一系列电脑的常用硬件功能单片机的任务是信息采集&#xff08;依靠传感器&#xff09;、处…

【Spark系列2】Spark编程模型RDD

RDD概述 RDD最初的概述来源于一片论文-伯克利实验室的Resilient Distributed Datasets&#xff1a;A Fault-Tolerant Abstraction for In-Memory Cluster Computing。这篇论文奠定了RDD基本功能的思想 RDD实际为Resilient Distribution Datasets的简称&#xff0c;意为弹性分…

Linux提权:Docker组挂载 Rsync未授权 Sudo-CVE Polkit-CVE

目录 Rsync未授权访问 docker组挂载 Sudo-CVE漏洞 Polkit-CVE漏洞 这里的提权手法是需要有一个普通用户的权限&#xff0c;一般情况下取得的webshell权限可能不够 Rsync未授权访问 Rsync是linux下一款数据备份工具&#xff0c;默认开启873端口 https://vulhub.org/#/envir…

Linux:共享内存

文章目录 System V共享内存的原理管理共享内存shmgetshmatshmdtshmctl 共享内存和管道实现进程间同步通信 前面介绍完了匿名管道和命名管道&#xff0c;那么本篇要引入的主题是共享内存 System V 作为进程通信部分的内容&#xff0c;共享内存必然有其存在的意义和价值&#x…

RabbitMQ快速实战

目录 什么是消息队列&#xff1f; 消息队列的优势 应用解耦 异步提速 削峰填谷 总结 主流MQ产品特点比较 Rabbitmq快速上手 创建用户admin Exchange和Queue Connection和Channel RabbitMQ中的核心概念总结 什么是消息队列&#xff1f; MQ全称Message Queue&#xf…

从零学习Linux操作系统 第二十二部分 企业域名解析服务的部署及安全优化

# 一、dns的主要信息 关于dns的名词解释&#xff1a;dns: domain name service(域名解析服务) 关于客户端: /etc/resolv.conf dns指向文件 A记录 ##ip地址叫做域名的Address 记录 SOA ##授权起始主机 关于服务端 bind安装包named服务名称/etc/named.conf主配置文件/var/na…