机器学习(3)

news2024/12/24 0:17:52

目录

3-1线性回归

3-2最小二乘解

3-3多元线性回归

3-4广义线性模型

3-5对率回归

3-6对率回归求解

3-7线性判别分析        

3-8LDA的多类推广

3-9多分类学习基本思路

3-10类别不平衡


3-1线性回归

线性模型为什么重要?

人类在考虑问题时,通常很难直接思考非线性的问题

线性模型:试图学得一个通过属性的线性组合来进行预测的函数

优点:简单,基本,可理解性好

线性回归

“线性回归”试图学得一个线性模型以尽可能地预测实值输出标记。

均方误差有非常好的几何意义,它对应了常用的欧几里得距离或简称“欧式距离”。基于均方误差最小化来进行模型求解的方法为“最小二乘法”。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧氏距离之和最小。

3-2最小二乘解

求解w和b使E(w,b)最小化的过程,称为线性回归模型的最小二乘“参数估计”

偏导的物理意义表示的是变化率(理解为什么令导数为0)

3-3多元线性回归

我们把包括两个或两个以上自变量的回归称为多元线性回归。

同样令其为零可得最优解得闭式解,但由于涉及逆矩阵的计算,比单变量情形要复杂一些,需要做简单的讨论。

若存在逆矩阵,直接求解

若不存在,加上不同的归纳偏好,即引入正则化项

3-4广义线性模型

线性模型虽然简单,却有着丰富的变化

广义线性模型,线性模型经过操作来逼近y,其中函数g()被称为“联系函数”

3-5对率回归

考虑“二分类任务”,而线性回归模型产生的预测值是实值,于是我们需要将实值转换成0/1值。

最理想的是“单位阶跃函数”,但性质不好,我们需要找到替代函数,“对数几率函数”,简称
“对率函数”。

“对数几率回归”虽然名字是回归,但它实际却是一种分类学习方法

3-6对率回归求解

求解思路

3-7线性判别分析        

如何用线性模型直接做分类?线性判别分析简称LDA

同类尽可能近,异类尽可能远。

将样例投影到一条直线,可看作降维技术。

LDA的目标(最大化广义瑞丽商)

求解过程

3-8LDA的多类推广

LDA推广到多类

3-9多分类学习基本思路

现实中常遇到多分类学习任务。有些二分类学习方法可直接推广到多分类。但在更多情形下,我们是基于一些基本策略,利用二分类学习器来解决多分类问题。

多分类学习的基本思路是“拆分法”。最典型的拆分策略有三种:“一对一”(简称“OvO”),“一对其余”(简称OvR),“多对多(简称MvM)"

3-10类别不平衡

前面介绍的分类学习方法都有一个共同的假设,即不同类别的训练样本数目相当。但若不同类别的训练样例差距过大,则会对学习过程造成很大的影响。

也不是所有的类别不平衡都要处理,只有当丢掉的小类价值很高时才进行处理。(eg:信用卡检测)

过采样:增加小类的采样,在中间插值

欠采样:减少大类的采样,丢弃部分数据

阈值移动:修改阈值

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1679395.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

德国储能项目锂电池储能集装箱突发火灾:安全挑战再引关注

2024年4月27日,德国尼尔莫尔商业区的一起锂电池储能集装箱火灾事件引起了全球关注。这起事故不仅导致两名消防员在救援过程中受伤,更暴露了储能系统在安全领域亟待解决的重要问题。 根据德国消防队的出警记录,火灾发生在晚上9点前不久。消防人…

【电路笔记】-有源低通滤波器

有源低通滤波器 文章目录 有源低通滤波器1、概述2、有源低通滤波器2.1 一阶低通滤波器2.2 带放大功能的有源低通滤波器3、有源低通滤波器示例4、二阶低通有源滤波器通过将基本的 RC 低通滤波器电路与运算放大器相结合,我们可以创建一个具有放大功能的有源低通滤波器电路。 1、…

【半夜学习MySQL】内置函数(含日期、字符串、数学等函数常用用法介绍及示例详解)

🏠关于专栏:半夜学习MySQL专栏用于记录MySQL数据相关内容。 🎯每天努力一点点,技术变化看得见 文章目录 日期函数字符串函数数学函数其他函数 日期函数 函数名称描述current_date()当前日期current_time()当前时间current_time()…

Linux平台和Windows平台互传文件

rz和sz的出发对象都是从Linux出发的,例如sz发送(Send)从Linux->发送到Windows。 rz 从Windows文件发送到Linux中 先创立一个新文本文件 之后将hello Windows输入到该文本文件中 在显示器上显示里面是否有hello Windows内容 sz发送Lin…

yolov8使用与训练步骤

第一:安装miniconda 网址:Index of /anaconda/miniconda/ 登录网址后 在网页按ctrF 输入:搜py38 Miniconda3-py38_22.11.1-1-Windows-x86_64.exe 52.5 MiB 2022-12-23 07:57 下载进行安装 安装过程中记得加环境变量这个项。 第二…

2024年最新软件测试面试题必问的1000题!

我了解的测试理论和方法包括以下几个方面: 黑盒测试与白盒测试: 黑盒测试:基于对软件系统外部行为进行测试,独立于内部代码实现细节。黑盒测试关注输入与输出之间的关系以及软件功能是否符合预期。白盒测试:基于对软件…

k8s 部署 CoreDNS master02 节点部署 负载均衡部署

目录 一、部署 CoreDNS 1.1.在所有 node 节点上操作 1.2.在 master01 节点上操作 1.3.DNS 解析测试 二、master02 节点部署 2.1.从 master01 节点上拷贝证书文件、各master组件的配置文件和服务管理文件到 master02 节点 2.2.修改配置文件kube-apiserver中的IP 2.3.在 …

RT-Thread中使用Mqtt

环境: 开发板:Panduola(stm32L475) KEIL5 开发环境 rtthread 4.0.3内核 使用ENV 配置Rtt MQTT 1.MQTT介绍 ​ 客户端 Client 使用MQTT的程序或设备。客户端总是通过网络连接到服务端。它可以发布应用消息给其它相关的客户端。订…

记笔记从学Typora开始--------------------(1)下载、安装、购买、激活

一、登录Typora官网 官网地址:Typora 二、鼠标往下滑,点击下载按钮 三、下载得到安装包,双击 四、一直点击下一步,进行安装 五、安装完成 六、启动Typoera 七、针对欢迎界面点击下一页 八、一直点击直到弹出以下软件激活界面 九…

企业OA办公系统开发笔记:1、搭建后端环境

文章目录 企业办公系统:搭建环境一、项目介绍1、介绍2、技术栈3、项目模块4、数据库 二、搭建环境1、搭建后端1.1、搭建父工程clfwzx-oa-parent1.2、搭建工具类父模块common1.3、搭建工具类common的子模块1.4、搭建实体类模块model和项目模块service-oa 2、配置依赖…

经济寒冬 | 品牌策划人还可以去哪些行业发展?

在这个经济寒冬下,咱们品牌策划人也需要考虑后路问题了。 随着市场竞争的加剧和消费者需求的不断变化,品牌策划人的工作不再只是简单的广告宣传和市场推广。 咱们需要重新思考自己的角色,寻找新的生存和发展之道。 当然,品牌策…

基于Python的jieba库分析《斗破苍穹》文本中的高频词汇

分析《斗破苍穹》文本中的高频词汇 在进行文本分析时,了解文本中出现频率较高的词汇对于把握文本的主题和风格非常有帮助。本文将介绍如何使用Python的jieba库对《斗破苍穹》这部小说的文本进行分词处理,并统计高频词汇的出现次数(本文只统计…

idea连接远程仓库

git ->克隆。 url为远程仓库的地址,输入好后,选择项目存放目录,再点击克隆 点击新窗口打开。 切换到对应分支

[AI开发配环境]jupyter notebook远程连接ssh

照这个操作: https://blog.csdn.net/wuqrcn/article/details/135512396 步骤 安装并生成配置文件 注意,在base环境中安装,这样在其他所有环境中都能用,到时候选环境即可。 pip install jupyter notebook # 安装jupyter notebo…

TopOn 正式聚合Kwai 旗下程序化广告平台——Kwai Network

**我们非常高兴的宣布,TopOn SDK 近日已正式聚合Kwai Network。**作为Kwai 旗下的程序化广告平台,Kwai Network 通过优质的变现能力及产品能力,为广大开发者提供高效及时的服务。 TopOn 聚合平台与Kwai Network 正式完成接入后,开…

SOP for Oracle 23ai:Python 连接 Oracle 的两种方法

前情回顾 前文介绍了如何使用 python-oracledb 连接 Oracle 23ai 数据库,并演示了如何使用独立连接方式。 其中提到了支持两种连接池: DRCP 和 PRCP。 本文将对这两种连接池做具体演示。 DRCP 和 PRCP 连接池 连接池技术的优点不言而喻: 缩短…

mysql----武侠剑客之-----MEMORY 存储引擎

文章目录 mysql--------MEMORY 存储引擎1、1 特点:1、2 代码演示: mysql--------MEMORY 存储引擎 1、1 特点: 1.frm文件存储表的结构信息 2 数据存放在内存中,没有表数据文件,重启后,数据丢失 3 使用表…

探索Playwright:Python下的Web自动化测试革命

在如今这个互联网技术迅速发展的时代,web应用的质量直接关系着企业的声誉和用户的体验。因此,自动化测试成为了保障软件质量的重要手段之一。今天,我将带大家详细了解一款在测试领域大放异彩的神器——Playwright,并通过Python语言…

栈和队列经典面试题详解

目录 题目一:20. 有效的括号 - 力扣(LeetCode) 题目二:225. 用队列实现栈 - 力扣(LeetCode) 题目三:232. 用栈实现队列 - 力扣(LeetCode) 题目四:622. 设…

网络安全 会飞的狗狗 网络安全狗是什么

1.概述 网站安全狗是一款集网站内容安全防护、网站资源保护及网站流量保护功能为一体的服务器工具。功能涵盖了网马/木马扫描、防SQL注入、防盗链、防CC攻击、网站流量实时监控、网站CPU监控、下载线程保护、IP黑白名单管理、网页防篡改功能等模块。能够为用户提供实时的网站安…