【机器学习】--- 逻辑回归算法

news2025/7/7 14:23:41

逻辑回归基础

1. 概述

逻辑回归是机器学习的一种分类算法，主要运用于二分类问题。将线性回归的结果，映射到不同的类别之中。算法简单而高效，实际广泛运用。

简单来说：逻辑回归 = 线性回归 + $S i g m o i d$ 函数（分类函数）

2.优点与缺点

优点：

简单而且容易实现。逻辑回归的模型相对简单，只需要对输入特征进行线性组合，然后通过 $S i g m o i d$ 函数进行分类预测。
计算效率高。逻辑回归的计算量相对较小，可以处理大规模的数据集。
可解释性强。逻辑回归的结果可以解释为某个事件发生的概率，比较直观易懂。
可以在线学习。逻辑回归可以通过梯度下降算法进行在线学习，适用于增量学习和实时预测。

缺点：

对特征的依赖性强。逻辑回归对特征之间的依赖性较为敏感，如果特征之间存在较强的相关性，会导致模型效果较差。
对异常值较为敏感。逻辑回归对异常值较为敏感，可能会影响模型的预测结果。
需要大量的特征工程。为了提高逻辑回归的性能，通常需要进行大量的特征工程，包括特征选择、特征变换等。
无法处理非线性问题。逻辑回归是一种线性模型，无法处理非线性问题，需要通过添加多项式特征或者引入核函数来解决非线性问题。

逻辑回归的理论解释

1.问题背景

现在你有一份数据，里面有病人的肿瘤大小（tumor size）和是否是恶性肿瘤的判断（malignant？），把这份数据可视化，用1来表示恶性肿瘤，0表示良性，这样你就获得了下面这张图。
在这里插入图片描述
根据上面的图你可以简单的总结一个函数，如红线所示，来帮助你判断肿瘤是否恶性，现在又来了一个病人，他的肿瘤大小用紫色点表示，根据我们总结的函数，判断出有70%的概率肿瘤是恶性，但是你不能直接输出0.7，只能判断是或否，因此你会输出1（yes），这一条你总结出来的函数就是 $S i g m o i d$ 函数
在这里插入图片描述

2. $S i g m o i d$ 函数

也称为逻辑函数，具体函数定义如下
$\frac{1}{1+e^{-z}}$

x坐标是z的值，范围是负无穷到正无穷
值域是（0，1）
图像如下

那么 $z$ 的值是由谁决定的？还记得文章一开头讲的：逻辑回归 = 线性回归 + $S i g m o i d$ 函数（分类函数）， $z$ 的值是从线性回归中得来的
在这里插入图片描述
$z = w^Tx+b$
逻辑回归函数表达
$f_{w,b}(x) = g(z) = g(w^Tx+b) = \frac{1}{1+e^{-(w^Tx+b)}}$

3.决策边界

函数输出0还是1，取决于 $f_{w,b}(x) \ge 0.5$ ，若成立，那么 $\hat{y} =1$ ，反之 $\hat{y}=0$

下图是一组数据集，蓝色圆圈 $\hat{y}$ 输出为0，红色交叉 $\hat{y}$ 输出为1，经过逻辑回归可以获得其回归函数
在这里插入图片描述

根据 $S i g m o i d$ 函数， $z = 0$ 点就是两个类别的分隔点

$z = x_1 +x_2 -3 = 0$
$x_1 +x_2 = 3$

在这里插入图片描述
那么得到的这条线，就叫做决策边界，只要点出现在决策边界下方，就输出0，出现在决策边界上方，就输出1

在这里插入图片描述

当然，决策边界也不一定是直线，也可以是曲线

$z = x_1^2 +x_2^2 -1$
$x_1^2 +x_2^2 = 1$

4.损失函数

$L(f_{w,b}(x^{(i)}),y^{(i)})= \begin{cases} -log(f_{w,b}(x^{(i)})), & \text {if $y^{(i)} = 1$} \\\\ -log(1-f_{w,b}(x^{(i)})), & \text{if $y^{(i)}=0$} \end{cases}$

$L(f_{w,b}(x^{(i)}),y^{(i)}) = -y^{(i)}log(f_{w,b}(x^{(i)}))+(1-y^{(i)})log(1-f_{w,b}(x^{(i)}))$
以上两条式子完全等价
那么代价函数就是每一个点的损失累加起来
$\frac{1}{m}\sum_{i=1}^m L(f_{w,b}(x^{(i)}),y^{(i)})$
使用梯度下降的方法，找到代价函数的1阶导最小值即可，有关梯度下降的介绍可以看线性回归中的介绍
【机器学习】-- 线性回归算法