机器学习深度学习——线性回归

news2025/1/17 6:13:17

之前已经介绍过线性回归的基本元素和随机梯度下降法及优化,现在把线性回归讲解完:

线性回归

  • 矢量化加速
  • 正态分布与平方损失
  • 从线性回归到深度网络
    • 神经网络图
    • 生物学

矢量化加速

在训练模型时,我们常希望能够同时处理小批量样本,所以我们需要对计算进行矢量化,从而利用线性代数库,而不是使用效率低下的for循环,下面通过代码来直观展示矢量化的高效:

import math
import time
import numpy as np
import torch
from d2l import torch as d2l

n = 10000
a = torch.ones([n])
b = torch.ones([n])

# 定义一个计时器
# 注释#@save是一个特殊的标记,会将对应的函数、类或语句保存在d2l包中
class Timer:  #@save
    """记录多次运行时间"""
    def __init__(self):
        self.times = []
        self.start()

    def start(self):
        """启动计时器"""
        self.tik = time.time()

    def stop(self):
        """停止计时器并将时间记录在列表中"""
        self.times.append(time.time() - self.tik)
        return self.times[-1]

    def avg(self):
        """返回平均时间"""
        return sum(self.times) / len(self.times)

    def sum(self):
        """返回时间和"""
        return sum(self.times)

    def cumsum(self):
        """返回累计时间"""
        return np.array(self.times).cumsum().tolist()

# 计算for循环时间
c = torch.zeros(n)
timer = Timer()
for i in range(n):
    c[i] = a[i] + b[i]
print(f'for循环所用时间:{timer.stop():.9f} sec')

# 计算重载的+运算符来计算按元素的和
timer.start()
d = a + b
print(f'矢量化加速所用时间:{timer.stop():.9f} sec')

结果:

for循环所用时间:0.133013725 sec
矢量化加速所用时间:0.001002550 sec

正态分布与平方损失

在这里,通过对噪声分布的假设来解读平方损失目标函数。
正态分布(高斯分布)与线性回归的关系很密切。
概率分布概率密度函数如下:
p ( x ) = 1 2 π σ 2 e x p ( − 1 2 σ 2 ( x − μ ) 2 ) p(x)=\frac{1}{\sqrt{2π\sigma^2}}exp(-\frac{1}{2\sigma^2}(x-μ)^2) p(x)=2πσ2 1exp(2σ21(xμ)2)
接下来对正态分布进行可视化,代码如下:

import math
import numpy as np
import torch
from d2l import torch as d2l
import matplotlib.pyplot as plt

# 定义正态分布函数
def normal(x, mu, sigma):
    p = 1 / math.sqrt(2 * math.pi * sigma**2)
    return p * np.exp(-0.5 / sigma**2 * (x - mu)**2)

# 可视化正态分布

# 使用numpy进行可视化
x = np.arange(-7, 7, 0.01)
# 均值和标准差对
params = [(0, 1), (0, 2), (3, 1)]
d2l.plot(x, [normal(x, mu, sigma) for mu, sigma in params], xlabel='x',
         ylabel='p(x)', figsize=(4.5, 2.5),
         legend=[f'mean {mu}, std{sigma}' for mu, sigma in params])
d2l.plt.show()

在这里插入图片描述
可以发现,改变均值会产生沿x轴的偏移,增加方差会分散分布、降低峰值。
下面内容学之前先复习一下极大似然估计,很多地方都自己推一下印象很深刻
均方误差损失函数(简称均方损失)可以用于线性回归的原因是:我们假设了观测中包含噪声,其中噪声服从正态分布。噪声正态分布如下式:
y = w T x + b + δ 其中, δ 符合正态分布 N ( 0 , σ 2 ) y=w^Tx+b+\delta\\ 其中,\delta符合正态分布N(0,\sigma^2) y=wTx+b+δ其中,δ符合正态分布N(0,σ2)
因此,我们可以写出通过给定的x观测到特定y的似然:
P ( y ∣ x ) = 1 2 π σ 2 e x p ( − 1 2 σ 2 ( y − w T x − b ) 2 ) P(y|x)=\frac{1}{\sqrt{2π\sigma^2}}exp(-\frac{1}{2\sigma^2}(y-w^Tx-b)^2) P(yx)=2πσ2 1exp(2σ21(ywTxb)2)
现在,根据极大似然估计法,参数w和b的最优值是使整个数据集的似然最大的值:
P ( y ∣ X ) = ∏ i = 1 n p ( y ( i ) ∣ x ( i ) ) P(y|X)=\prod_{i=1}^np(y^{(i)}|x^{(i)}) P(yX)=i=1np(y(i)x(i))
根据极大似然估计法选择的估计量称为极大似然估计量。虽然会让很多指数函数的乘积最大化看起来很困难,但是可以在不改变目标情况下,通过最大化似然对数来简化,最终得到式子:
− l o g P ( y ∣ X ) = ∑ i = 1 n 1 2 l o g ( 2 π σ 2 ) + 1 2 σ 2 ( y ( i ) − w T x ( i ) − b ) 2 -logP(y|X)=\sum_{i=1}^n\frac{1}{2}log(2π\sigma^2)+\frac{1}{2\sigma^2}(y^{(i)}-w^Tx^{(i)}-b)^2 logP(yX)=i=1n21log(2πσ2)+2σ21(y(i)wTx(i)b)2
现在只需要假设σ是某个固定常数就可以忽略第一项,因为第一项不依赖于w和b。第二项除了常数外,其余部分和前面介绍的均方误差是一样的。
上式的解不依赖于σ,因此,在高斯噪声的假设下,最小化均方误差等价于对线性模型的极大似然估计。

从线性回归到深度网络

神经网络图

在这里插入图片描述
如上图,就是讲线性回归模型描述为了神经网络,容易看出它是单层神经网络,该图只展示了连接模式,略去了权重和偏置。
该图中的特征维度(输入层中的输入数)为d。
对于线性回归,每个输入都与输出相连,成这种变换为全连接层

生物学

树突接收来自其他神经元的信息xi,该信息通过突触权重wi来加权,来确定输入的影响(通过xi与wi相乘来激活或抑制)。
来自多个源的加权输入以加权和
y = ∑ x i w i + b y=\sum x_iw_i+b y=xiwi+b
的形式汇聚在细胞核中,将这些信息发送到轴突y中进一步处理,通常会通过σ(y)进行一些非线性处理。之后要么到达目的地(如肌肉)要么进入另一个神经元。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/780121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

涵子来信——自己的电脑——谈谈想法

大家好: 上一次谈论了苹果的那些事,今天我们来聊聊电脑。 我的第一台电脑现在成了这样子: 很多人以为是我自己拆了电脑做研究,其实是我的第一台电脑,真的坏了。 2021年,我有了属于我自己的第一台电脑&am…

STM32 HAL库串口重映射printf

添加代码 #include "stdio.h" int fputc(int ch, FILE *f) {HAL_UART_Transmit(&huart1, (uint8_t *)&ch, 1, 0xFFFF);return ch; }keil设置 实现效果: 打印变量 printf("Hello, I am %s\r\n", "iii"); // printf输出字符…

Kubernetes pv-pvc-nfs-service综合实验

目录 实验:pv-pvc-nfs-service综合实验 实验环境 实验描述 实验拓扑图: 实验步骤: 1、修改nfs服务器的主机名: 2、搭建nfs服务器:(131条消息) 搭建NFS服务器_搭建nfs存储_Claylpf的博客-CSDN博客 3、测试k8s上…

极速跳板机登陆服务器

目录 一:简单登陆跳板器二:一键申请相关的服务器权限三:简化登陆 一:简单登陆跳板器 登陆公司提供的网址, 下载自己的专属RSA密钥。在密钥文件处, 执行登陆指令: ssh -p 36000 -i id_rsa 用户跳…

【MATLAB】 二维绘图,三维绘图的方法与函数

目录 MATLAB的4种二维图 1.线图 2.条形图 3.极坐标图 4.散点图 三维图和子图 1.三维曲面图 2.子图 MATLAB的4种二维图 1.线图 plot函数用来创建x和y值的简单线图 x 0:0.05:30; %从0到30,每隔0.05取一次值 y sin(x); plot(x,y) %若(x,y,LineWidth,2) 可…

mac 移动硬盘未正常退出,再次链接无法读取(显示)

(1)首先插入自己的硬盘,然后找到mac的磁盘工具 (2)打开磁盘工具,发现自己的磁盘分区在卸载状态;点击无法成功装载。 (3)打开终端,输入 diskutil list查看自…

Spring Cloud【Resilience4j(重试机制、异常比例熔断降级、信号量隔离实现、线程池隔离实现、限流 ) 】(五)

目录 服务断路器_Resilience4j重试机制 服务断路器_Resilience4j异常比例熔断降级 服务断路器_Resilience4j慢调用比例熔断降级 服务断路器_Resilience4j信号量隔离实现 服务断路器_Resilience4j线程池隔离实现 服务断路器_Resilience4j限流 服务网关Gateway_微服务中…

Docker 的数据管理、容器互联、镜像创建

目录 一、数据管理 1.数据卷 2. 数据卷容器 二、容器互联(使用centos镜像) 三、Docker 镜像的创建 1.基于现有镜像创建 1.1首先启动一个镜像,在容器里修改 1.2将修改后的容器提交为新的镜像,需使用该容器的id号创建新镜像 …

JAVA设计模式——模板设计模式(itheima)

JAVA设计模式——模板设计模式(itheima) 文章目录 JAVA设计模式——模板设计模式(itheima)一、模板类二、子类2.1 Tom类2.2 Tony类 三、测试类 一、模板类 package _01模板设计模式;public abstract class TextTemplate{public final void write(){System.out.println("&…

使用 Docker 快速上手官方版 LLaMA2 开源大模型

本篇文章,我们聊聊如何使用 Docker 容器快速上手 Meta AI 出品的 LLaMA2 开源大模型。 写在前面 昨天特别忙,早晨申请完 LLaMA2 模型下载权限后,直到晚上才顾上折腾了一个 Docker 容器运行方案,都没来得及写文章来聊聊这个容器怎…

c# 使用socket进行tcp通信

服务端开启监听代码示例: //服务端开启监听示例Socket ListenSocket;private void btnStartListen_Click(object sender, EventArgs e){if (ListenSocket null){ListenSocket new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);IPAd…

【cef】2023最新windows编译全流程

▒ 目录 ▒ 🛫 导读需求开发环境 1️⃣ 准备工作环境准备确定要编译的cef版本 2️⃣ 搭建编译环境保证可以访问chrome源码创建代码目录下载自动构建脚本创建.boto文件checkout 版本号创建2个编译脚本 3️⃣ 开始编译下载代码真正的拉取代码修改.gclient运行build.ba…

Debezium日常分享系列之:在 OpenShift 上部署 Debezium

Debezium日常分享系列之:在 OpenShift 上部署 Debezium 一、先决条件二、部署 Strimzi Operator三、为数据库创建机密四、部署Apache Kafka五、部署数据源六、部署 Debezium 连接器七、创建 Debezium 连接器八、验证部署 此过程用于在 Red Hat 的 OpenShift 容器平台…

【C++技能树】Vector类解析与模拟实现

Halo,这里是Ppeua。平时主要更新C语言,C,数据结构算法…感兴趣就关注我bua! Vector 0.Vector简介1.Vector常用接口1.1constructor构造函数1.2 iteratorsort与findfindsort 1.3 Capacity相关接口1.4 Modify相关接口 2. Vector模拟实…

uniapp 微信小程序 placeholder字体、颜色自定义

效果图&#xff1a; 1、template <input type"text" placeholder"搜索标题" placeholder-class"placeholder-style"></input>2、style .placeholder-style{color: #2D94FF; }

python_day13_综合案例

导包准备 from pyspark import SparkConf, SparkContext import os import jsonos.environ["PYSPARK_PYTHON"] "D:/dev/python/python3.10.4/python.exe" conf SparkConf().setMaster("local[*]").setAppName("test_spark") sc Sp…

生命游戏(力扣)思维 JAVA

根据 百度百科 &#xff0c; 生命游戏 &#xff0c;简称为 生命 &#xff0c;是英国数学家约翰何顿康威在 1970 年发明的细胞自动机。 给定一个包含 m n 个格子的面板&#xff0c;每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态&#xff1a; 1 即为 活细胞 &…

FreeRTOS源码分析-4 SysTick系统时钟详解

目录 1 SysTick初始化 2 SysTick中断服务函数 3 SysTick任务调度 1 SysTick初始化 初始化流程 配置SysTick装载值使能SysTick时钟源 使能SysTick中断 使能SysTick 其中装载值1ms、10ms、100ms都可以&#xff0c;但是不要小于1ms //main.c //--->osKernelStart(); //--…

vue开源基础框架之岗位管理配置及使用

JVS是面向软件开发团队可以快速实现应用的基础开发脚手架&#xff0c;主要定位于企业信息化通用底座&#xff0c;采用微服务分布式框架&#xff0c;提供丰富的基础功能&#xff0c;集成众多业务引擎&#xff0c;它灵活性强&#xff0c;界面化配置对开发者友好&#xff0c;底层容…

机器视觉:工业自动化和智能化的核心技术

机器视觉作为实现工业自动化和智能化的关键核心技术&#xff0c;是人工智能领域发展最迅速的分支之一。它包括四个关键构件&#xff1a;光源、摄像机、图像采集卡和视觉处理软件&#xff08;集成了AI算法&#xff09;。其中&#xff0c;图像采集卡是工厂自动化中常用的外购组件…