【机器学习】十大算法之一 “线性回归”

news2024/12/24 21:31:08

 

作者主页:爱笑的男孩。的博客_CSDN博客-深度学习,活动,python领域博主爱笑的男孩。擅长深度学习,活动,python,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域.https://blog.csdn.net/Code_and516?type=blog个人简介:打工人。

持续分享:机器学习、深度学习、python相关内容、日常BUG解决方法及Windows&Linux实践小技巧。

如发现文章有误,麻烦请指出,我会及时去纠正。有其他需要可以私信我或者发我邮箱:zhilong666@foxmail.com 

 

        对于数据科学和机器学习领域的专业人员来说,线性回归算法是一项必学技能。线性回归建立在数学基础上,是机器学习区别于传统计算机算法的一个关键方面。

本文将详细讲解机器学习十大算法之一“线性回归”


目录

一、简介

二、发展史

三、算法公式

        1. 简单线性回归

        2. 多元线性回归

四、算法原理

五、算法功能

六、示例代码

        完整代码

七、总结 


一、简介

        机器学习是人工智能的一个重要分支,它利用各种算法和模型,通过分析和理解数据,让机器学习到一个智能模型,从而对数据作出预测和判断。

        回归分析是一种基于统计学方法的数学分析技术,用于描述两个或多个变量之间的关系。线性回归是一种最简单的回归分析方法,它使用最小二乘法来拟合一个关于自变量的线性函数,以预测其与因变量之间的相互作用关系。

        线性回归是机器学习领域中最为常见的算法之一,它是一个简单但非常有效的算法,常用于数据挖掘和机器学习的预测分析,例如房价预测、销售额预测等等。它是一种最简单的算法,但是能够显示出非常高的准确度。

二、发展史

        线性回归算法的历史可以追溯到18世纪初。最早的应用可以追溯到1757年,当时政治学家、经济学家、统计学家约翰·格拉斯哥(John Graunt)使用回归分析方法来探究英国人口与疾病之间的关系。

        尽管线性回归方法的数学基础是在19世纪初被发现的,但其实际应用则在20世纪20年代及30年代才真正开始拓展。这是因为直到计算机的发明,我们才具备了处理如此复杂的计算所需的计算能力。并且线性回归被认为是最早的回归分析方法之一。

        19世纪末,当时高斯和勒让德独立地开发了最小二乘法。这种方法可以对数据进行拟合,并找到最适合的一条直线来表示数据之间的关系。1895年,皮尔逊提出了相关系数的概念,将线性回归引入统计学领域。20世纪前半叶,Fisher、Neyman等人提出了一系列参数估计方法,进一步发展了线性回归模型。20世纪后半叶,随着计算机技术和数据处理能力的提高,线性回归算法不断得到完善和拓展,如岭回归、Lasso、ElasticNet等。

        计算机硬件的发展极大程度地促进了线性回归算法的拓展,可用的数据量和数据复杂度都得以不断提高。直至今日,研究人员和学者们继续探索和改进线性回归算法,以期其能得到更好的拟合效果。

三、算法公式

        线性回归算法用于预测连续值的单变量或多变量方法。在机器学习中,X通常表示自变量或特征,Y表示因变量或预测结果。线性回归是由以下方程组成的线性模型:

        其中,β0​,β1​,...,βn​称为参数,x1​,x2​,...,xn​称为特征,ϵ称为误差项。线性回归的目标是通过最小化误差项,找到最适合数据的参数。 

        线性回归有两种常见的类型:简单线性回归和多元线性回归。在简单线性回归中,自变量只有一个,因变量为连续值。多元线性回归则包括两个或多个自变量,并且仍然预测一个连续值的因变量。

        1. 简单线性回归

        简单线性回归只有一个自变量和一个因变量,其模型可表示为:

        其中,y表示因变量,x表示自变量,β0​为截距,β1​为斜率,ϵ为误差项。 

        对于简单线性回归,我们的目标是找到最适合数据的β0​ 和β1​。这意味着我们需要找到一条直线,使得每个数据点到线的距离最小,即使误差项最小化。最小化误差的方法是使用最小二乘法,它是一种常用的统计方法,可以用于拟合线性回归模型。最小二乘法的做法是使得各数据点到直线的距离平方和最小。这些距离以误差项的形式来表示,即:

        其中,y^​表示直线上某个数据点的预测值,yi​表示实际的因变量值。 

        为了找到最优的 β0​ 和 β1​,我们需要通过以下公式求解:

        其中,xˉ和yˉ​分别表示自变量和因变量的平均值。

        2. 多元线性回归

        多元线性回归是通过使用两个或多个自变量和一个连续因变量来建立模型。与简单线性回归类似,我们可以使用最小二乘法来拟合数据。其模型可表示为:

        其中,x1​,x2​,...,xp​称为特征或自变量,β0​,β1​,...,βp​称为参数,ϵ称为误差项。 

        多元线性回归的目的是找到最具预测性的独立变量的贡献,并用这些变量来建立最佳模型。为了找到最优的 βi​,我们需要求解以下公式:

        其中,βi​为参数,Y为因变量,X为自变量矩阵,X^T为矩阵的转置。

四、算法原理

        线性回归算法的原理非常简单,它可以简单描述为以下几个步骤:

  1. 收集数据:通过收集自变量和因变量的数据,建立数据集。

  2. 处理数据:对数据进行处理,例如去除异常值、填补缺失值、标准化数据等。

  3. 拟合模型:使用最小二乘法拟合线性回归模型。

  4. 预测结果:通过新的自变量值,使用拟合好的线性模型预测因变量的值。

        线性回归算法的重要性在于其简单性和可解释性。该算法旨在确定因变量与自变量之间是否存在一种线性关系。如果存在的话,我们可以使用模型的参数来描述这种线性关系,进而对新的数据进行预测。

        比如,我们可以使用线性回归模型来预测房屋的价格。为此,我们需要收集一些数据,例如房屋的面积、所在位置、建筑年代等等。通过这些数据,我们可以拟合一个线性模型,以描述房屋价格与这些变量之间的关系。最后,我们可以使用这个线性模型来预测新房屋的价格。

五、算法功能

        线性回归算法是一种非常有用的工具,它可以用于许多应用程序,如预测房价、股票价格、销售额、客流量等。线性回归算法广泛应用于广告、金融、物流和其他行业中。以下是线性回归算法的主要功能和应用:

  1. 预测:线性回归可以用于预测因变量与自变量之间的关系。例如,我们可以使用线性回归来预测新的销售额。

  2. 探索性分析:线性回归可以用于探索性分析。例如,我们可以使用线性回归来分析两个或多个因变量之间的关系。

  3. 假设检验:线性回归可以用于假设检验。例如,我们可以使用线性回归来测试两个或多个变量之间的关系是否显著。

  4. 模型选择:线性回归可以用于模型选择。例如,我们可以比较不同的模型来确定哪一个最适合我们的数据。

  5. 拓展性:线性回归非常容易扩展。它可以轻松应用到多元线性回归,也可以应用于非线性回归。

  6. 解析性计算:线性回归可以进行解析计算,而不需要通过特定的算法获得可靠的结果。

  7. 易理解性:线性回归是一种简单而可理解的算法,它不需要进行过多的数学或统计学习。

六、示例代码

        下面我们通过一个简单的例子来演示线性回归算法的应用。

        首先,我们需要准备一些样本数据,以房价预测为例,每个样本有两个特征:房屋面积和房间数量。样本数据可以存储在一个CSV文件中,如下所示:

area,rooms,price
2600,3,550000
3000,4,565000
3200,4,610000
3600,5,680000
4000,6,725000

        接下来,我们可以使用Python中的Pandas库来读取数据文件: 

import pandas as pd

df = pd.read_csv('data.csv')
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values

        然后,我们可以使用Scikit-Learn库中的线性回归模型来进行训练和预测: 

from sklearn.linear_model import LinearRegression

regressor = LinearRegression()
regressor.fit(X, y)
y_pred = regressor.predict(X)

        最后,我们可以将预测结果进行可视化,如下所示: 

import matplotlib.pyplot as plt

fig, ax = plt.subplots()
ax.plot(X[:, 0], y, 'o', label='Data')
ax.plot(X[:, 0], y_pred, 'r-', label='Linear Regression')
ax.legend()
plt.show()

        该代码将生成一张图,显示出样本数据和线性回归模型的预测结果。从图中可以看出,线性回归模型较好地拟合了样本数据: 

        完整代码

# -*- coding: utf-8 -*-
import pandas as pd
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt


if __name__ == '__main__':
    df = pd.read_csv('data.csv')
    X = df.iloc[:, :-1].values
    y = df.iloc[:, -1].values
    regressor = LinearRegression()
    regressor.fit(X, y)
    y_pred = regressor.predict(X)
    fig, ax = plt.subplots()
    ax.plot(X[:, 0], y, 'o', label='Data')
    ax.plot(X[:, 0], y_pred, 'r-', label='Linear Regression')
    ax.legend()
    plt.show()

七、总结 

        使用线性回归算法进行样本数据的拟合和预测非常简单,只需要选择一个优秀的Python机器学习库,如Scikit-Learn或TensorFlow等,即可完成代码的编写和运行。

        线性回归算法作为机器学习领域中最基础的算法之一,已被广泛应用于各种领域,包括科学、工程、医疗、社会科学等。使用线性回归算法,我们能够很好地处理线性关系的数据,预测结果也较为准确和稳定。

        然而,线性回归算法确实比较局限,只能处理一些简单的线性关系,无法很好地处理非线性关系的数据,且容易受到异常值和噪声的干扰。因此,在实际使用线性回归算法时,需要注意这些缺点,结合实际问题和数据特点进行合理选择。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/670026.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

什么是事件委托

文章目录 导文文章重点具体而言,事件委托包含两个主要角色:通过使用事件委托,可以实现以下优势: 代码示例 导文 事件委托是一种在软件开发中常用的设计模式,用于处理事件和回调函数。它允许一个对象(委托对…

数据帧转发过程中IP地址及MAC地址的变化

数据帧在交换机间转发 帧经过交换机时,其源、目标MAC是不会变的。 交换机内部的CPU会在每个端口成功连接时,通过将MAC地址和端口对应,形成一张MAC表。在今后的通讯中,发往该MAC地址的数据包将仅送往其对应的端口,而不…

odoo字段加密以及模糊显示

在信息时代,信息本身是把双刃剑,一方面它服务于我们的生产、生活、使我们受益; 一方面,信息的泄露可能对我们构成巨大的威胁。因此,客观上就需要一种有力的安全措施来保护机密数据不被窃取或篡改 。 数据加密与解密从宏观上讲是非…

[2022]DyOb-SLAM : Dynamic Object Tracking SLAM System

1.作者 Rushmian Annoy Wadud、Wei Sun 2.时间 2022 3.整体架构 DyOb-SLAM是DynaSLAM和VDO-SLAM的结合: 基于先验信息使用Mask RCNN分割出动态目标通过基于光流和场景流的算法对运动目标进行跟踪对静态点进行BA优化 输出: 当前帧显示ORB特征以及Masj信息和对…

探索Zabbix API:企业监控管理工具

新钛云服已累计为您分享754篇技术干货 Zabbix是一种流行的开源监控解决方案,其强大的API功能为用户提供了灵活且可扩展的监控管理能力。本文将介绍Zabbix API的基本概念和用法,以及如何利用API来简化监控配置、数据获取和自动化任务等方面的工作。 在现代…

数据结构 树

树的基本概念 树是一种非线性的数据结构,它由节点(node)和边(edge)组成。树的基本概念包括以下要点: 树由一个根节点(root)开始,根节点没有父节点,它可以有…

华为OD机试之阿里巴巴找黄金(III)(Java源码)

文章目录 阿里巴巴找黄金(III) 阿里巴巴找黄金(III) 题目描述 一贫如洗的椎夫阿里巴巴在去砍柴的路上,无意中发现了强盗集团的藏宝地,藏宝地有编号从0~N的箱子,每个箱子上面贴有一个数字。阿里…

Rancher创建arm架构的下游k8s集群

目录 前言添加自定义集群镜像源配置使用支持ARM架构的docker镜像 前言 费了些时间在成功在华为云arm架构的服务器上搭建了k8s集群,期间问题不断,以下是三个关键点: 确保网络能正常拉取所需镜像拉取的镜像需支持arm架构 否则报错&#xff1a…

SOFAStack 的下一个五年

文|宋顺(GitHub ID:nobodyiam) SOFAStack 社区开源负责人 蚂蚁集团高级技术专家 本文 3861 字 阅读 11 分钟 #01 回顾开源这五年 回想起 2018 年 4 月 19 日 SOFAStack 首次开源,当时的官宣文章中就提到了我们开源的初心&#xf…

C++——map/mutimap再理解

目录 1. map 1.1 map介绍 1.2 map的构造 1.3 map插入和删除 1.4 map的迭代器 1.5 map[ ]运算符重载 1.6 map的查找find 1.7 map的删除erase 1.8 map的其它函数 1.9 map的总结 2. multimap 2.1 multimap的介绍 2.2 mutimap的使用 1. map 1.1 map介绍 1、map是关联…

多窗口通信

1、基本概念 BroadcastChannel接口代理了一个命名频道,可以让指定 origin 下的任意 browsing context 来订阅它。它允许同源的不同浏览器窗口,Tab 页,frame 或者 iframe 下的不同文档之间相互通信。通过触发一个 message 事件,消…

第3讲:使用ajax技术实现异步登录功能(XMLHttpRequest)

封装XMLHttpRequest对象,实现ajax异步登录功能;用三种不同的方法实现登录功能, 方法一:返回文本内容; 方法二:返回JSON格式数据; 方法三:使用fastJSON生成JSON数据,返…

Tensorboard‘s sample_per_plugin

Tensorboard’s sample_per_plugin Tensorboard’s sample_per_plugin controls the step size of the slider. Draw the train images to tensorboard: step 0 writer SummaryWriter() for imgs, labels in train_loader:grid torchvision.utils.make_grid(imgs)writer.…

Android 设计中心 | 助您为各种设备类型轻松打造精彩界面

作者 / Android 开发者体验部设计负责人 Adhithya Ramakumar 和 Android 高级开发者关系工程师 Rebecca Gutteridge 我们推出了 Android 设计中心,帮助开发者更轻松地针对各种类型的设备构建引人注目的界面。 Android 设计中心https://developer.android.google.cn/…

转型内卷下,IT部门如何突围?

在数字化转型极度“内卷”的环境下,传统的IT运维方式无法应对当前的数字化发展需求,在转型过程中,IT部门不但要加深技术与业务的融合,还需要控制成本创造更高的效益。对信息部门的要求进一步提升。 需要明确的是,降本…

废品回收系统开发详细流程--干货分享

废品回收系统的未来可谓是一片光明。随着人们环保意识的不断提高,越来越多的人开始关注废品回收和再利用。这种趋势也在推动着废品回收系统的发展。 目前,各大城市都已经建立了自己的废品回收体系,并且逐渐形成了规模化、产业化运作。同时&a…

EAP如何帮助锂电池厂商提高产品质量?

锂电池作为现代电池技术的重要代表,广泛应用于电动车辆、便携式电子设备和能源储存系统等领域。随着市场竞争的加剧,锂电池厂商越来越注重产品质量的提升,而EAP(Equipment Automation Programming)系统正是帮助锂电池厂…

JavaScript——跟随图片变化改变网页背景

目录 基础模板 引入ColorThief库 获取图片主要颜色 实现渐变效果 JavaScript效果——跟随图片变化改变网页背景&#xff0c;效果如下所示&#xff1a; 基础模板 首先我们准备基础模板&#xff0c;模板代码如下所示&#xff1a; <script setup> import { ref } from…

Chat GPT提示词(prompt )入门指南

prompt 是什么 prompt 是“提示、引导”的意思。在 NLP &#xff08;自然语言处理&#xff09;领域&#xff0c;prompt 通常指的是向预训练模型输入的文本&#xff0c;用于引导生成模型生成指定的文本输出。 prompt 就像是一条指路路线&#xff0c;告诉计算机生成什么样的文本…

戴尔U盘重装系统Win10步骤和详细教程

戴尔电脑深受用户们的喜欢&#xff0c;那么如何使用U盘给戴尔电脑重装Win10系统呢&#xff0c;这让很多用户都犯难了&#xff0c;以下就是小编给大家分享的戴尔U盘重装系统Win10步骤和详细教程&#xff0c;按照这个教程操作&#xff0c;就能顺利完成戴尔U盘重装Win10系统的操作…