Datawhale X 南瓜书 task02学习笔记

Datawhale X 南瓜书 task02学习笔记

news2026/2/15 8:54:49

算法原理引入

样本点通常应该在模型的2侧，原因：在实际中，因为某种不可控的因素，测出来的样本点肯定是有误差的。如果样本数据点都在模型上，则说明在建立模型时，把误差也考虑进去了，这就是我们说的过拟合。
好的模型：样本点离模型距离最近；
正交回归：以样本点距模型的距离为评判标准的算法叫做正交回归。
线性回归：样本点做平行于y轴的线同模型交于一点，样本点同这一交点所构成的线段的长短是评判标准。（即误差）（误差最小的模型就是我们所要求的模型），（线性回归的）所有的误差的和叫做均方误差。也叫作：最小二乘法。

算法原理正篇

线性模型

基本形式

文字描述：试图学得一个通过属性的线性组合来进行预测的函数

数学描述：

许多非线性模型可以通过在线性模型的基础上引入层级结构或高维映射而得
w直观地呈现了各属性在预测中重要性，故线性模型的可解释性。

线性模型之线性回归

数据集形式：
特征工程如下：
1.对离散属性，若属性值之间存在”序“关系，可通过连续化将其转化为连续值:
eg:二值属性“身高”的取值“高”“矮”可转化为{1.0,0.0}；
三值属性“高度”的取值“高”“中”“低”可转化为{1.0,0.5,0.0};
2.若属性值间不存在序关系,假定有k个属性值,则通常转化为k维向量:
eg:属性“瓜类”的取值“西瓜”“南瓜”“黄瓜”可转化为(0,0,1),(0,1,0),(1,0,0).

线性回归的损失函数

下图中的二值离散特征中x1的含义是：好看，数值为1; x2的含义是：不好看，数值为0

有序的多值离散特征中x1的含义是：饭量小；x2的含义是：饭量中；x3的含义是：饭量大。

无序的多值离散特征中x4的含义是：=1表示是黄；x5的含义是：=1表示是黑；x6的含义是：=1表示是白；

线性回归的损失函数之最小二乘法

目的：试图找到一条直线，使所有样本到直线上的欧氏距离之和最小。

下图中的yi是预测值，f(xi)是实际值

3.4的式子旨在求出使这个式子最小的w和b

求解3.4的式子的过程如下：

将E（w,b）分别对w和b求导，得到

多元线性回归模型推理如下：

总结：多元线性回归就是把一元线性回归的x变成了有样例集的特征向量集（矩阵格式），其他都一样。

线性回归之对数线性回归

引入场景：示例所对应的输出标记是在指数尺度（指数的大小）上变化。
文字描述：将输出标记的对数作为线性模型逼近的目标。
数学描述：
实质：求输入空间到输出空间的非线性函数映射
取对的目的：将线性回归模型的预测值与真实值（值感觉比标记好理解）联系起来。
对数线性回归的示意图：

广义线性模型：

其中函数g(.)称为”联系函数“

对数线性回归模型是g(.)=ln(.)的特例

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2154068.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Linux使用常见问题指南

Linux使用常见问题指南

普通用户sudo权限问题我在普通用户Sun下,编写了一个.cc文件,然后用sudo权限安装gcc/g去运行该文件,却提示我如下: 原因当前的用户没有加入到sudo的配置文件里 #切换到root用户 su #编辑配置文件 vim /etc/sudoers #增加配置, 在打开的配置文件中，找到root ALL(A…

阅读更多...

波分技术基础 -- FEC

波分技术基础 -- FEC

信号在传输过程中，不可避免的会出现劣化、误码，FEC (Forward error correction) 技术确保通信系统在噪声和其他损伤的影响下，依然能够实现无错误传输。应用场景：长途密集波分系统（DWDM）实现方式&#xff…

阅读更多...

AI赋能篇：万物皆可播，AI视频直播新趋势，轻松打造24h不间断开播！

AI赋能篇：万物皆可播，AI视频直播新趋势，轻松打造24h不间断开播！

AI赋能篇：万物皆可播，AI视频直播新趋势，轻松打造24h不间断开播！ 在数字化浪潮的推动下，人工智能（AI）正以前所未有的速度渗透到我们生活的每一个角落，其中，AI视频直播作为…

阅读更多...

基于vue框架的储蓄卡业务管理系统的设计与实现28g6t（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。

基于vue框架的储蓄卡业务管理系统的设计与实现28g6t（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。

系统程序文件列表项目功能：客户,银行账户,存款记录,取款记录,转账记录,经理,柜员,贷款产品,贷款申请,放款信息,还款信息,离职申请,通知公告,用户反馈,开户申请开题报告内容基于Vue框架的储蓄卡业务管理系统设计与实现开题报告一、项目背景与意义随着金融科…

阅读更多...

智慧园区：解析集成运维的未来之路

智慧园区：解析集成运维的未来之路

随着科技的进步和社会的发展，智慧园区已经成为了城市建设的重要方向。作为一个集信息技术、通信技术、能源技术等多种技术于一体的综合性项目，智慧园区的建设具有极高的科技含量和产业复杂度。而在智慧园区的运维管理中，更是需要集成化的处理…

阅读更多...

unity3d入门教程八-飞机大战

unity3d入门教程八-飞机大战

unity3d入门教程八-飞机大战 19.2竖屏设置19.3主控脚本19.4制作子弹19.5制作飞机19.6制作怪物19.7击中目标19.8随机生成怪物19.9预制体怪物随机更换头像19.10怪物相关优化19.11游戏背景19.12游戏最终优化一、 HP显示二、怪物预制体三、分值显示四、背景音乐 19.2竖屏设置切换到…

阅读更多...

信息安全工程师（8）网络新安全目标与功能

信息安全工程师（8）网络新安全目标与功能

前言网络新安全目标与功能在当前的互联网环境中显得尤为重要，它们不仅反映了网络安全领域的最新发展趋势，也体现了对网络信息系统保护的不断加强。一、网络新安全目标全面防护与动态应对： 目标：建立多层次、全方位的网络安全防…

阅读更多...

安装黑群晖系统，并使用NAS公网助手访问教程（好文）

安装黑群晖系统，并使用NAS公网助手访问教程（好文）

由于正版群晖系统的价格不菲，对于预算有限的用户来说，安装黑群晖系统成为了一个不错的选择（如果您预算充足，建议选择白群晖）。如您对宅系科技比较感兴趣，欢迎查看本文，将详细介绍如何安装黑群晖…

阅读更多...

PAT甲级-1083 List Grades

PAT甲级-1083 List Grades

题目题目大意学生有姓名，编号和分数，给定分数区间，输出在这个区间内的人名和编号。输出顺序按照分数从高到低，没有重复的分数。思路非常简单的结构体排序题，定义一个结构体，按照题目条件sort就可以了…

阅读更多...

2--SpringBoot项目中员工管理、分类管理详解（一）

2--SpringBoot项目中员工管理、分类管理详解（一）

目录员工管理新增员工需求分析和设计代码开发实体类 Controller层 Service层接口 Service层实现类 Mapper层功能测试通过接口文档测试代码完善问题一解决问题二解决员工分页查询需求分析和设计代码开发设计DTO类封装PageResult Controlle…

阅读更多...

$微服务架构---Ribbon\Feign$

微服务架构---Ribbon\Feign

Ribbon(负载均衡) Ribbon概述在 SpringCloud 中， Nacos⼀般配合Ribbon进行使用，Ribbon提供了客户端负载均衡的功能，Ribbon利用从Nacos中读取到的服务信息，在调用服务节点提供的服务时，会合理的进行负载。 Ribbon作…

阅读更多...

Arthas vmoption（查看和修改 JVM里诊断相关的option）

Arthas vmoption（查看和修改 JVM里诊断相关的option）

文章目录二、命令列表2.1 jvm相关命令2.1.6 vmoption（查看和修改 JVM里诊断相关的option）举例1：vmoption 查看所有的选项举例2：vmoption MinHeapFreeRatio 查看指定的选项二、命令列表 2.1 jvm相关命令 2.1.6 vmoption&#x…

阅读更多...

精选写作技巧！分享4款ai写毕业论文可以写出公式表格的软件

精选写作技巧！分享4款ai写毕业论文可以写出公式表格的软件

在撰写毕业论文时，AI写作工具可以极大地提高效率和质量。以下是四款值得推荐的AI软件，它们不仅能够帮助生成高质量的论文初稿，还能处理公式和表格等复杂内容。传送门：https://www.aipaperpass.com?piclLGw 千笔-AIPassPaper是一…

阅读更多...

基于SpringBoot+Vue的私人牙科诊所管理系统

基于SpringBoot+Vue的私人牙科诊所管理系统

作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、SSM项目源码系统展示【2025最新】基于JavaSpringBootVueMySQL的…

阅读更多...

大模型学习记录之Agent部署

大模型学习记录之Agent部署

首先，需要明确大模型的概念，通过百度的文心一言的结果，我们得到如下概念： 大模型的特点大模型（Large Models） 在人工智能和机器学习领域，特别是深度学习领域，指的是那些具有大量参…

阅读更多...

SAP B1 Web Client MS Teams App集成连载四

SAP B1 Web Client MS Teams App集成连载四

过程/Procedure： 1.通过点击选项卡旁边的下拉箭头，可以重新配置、重命名和移除现有选项卡。 You can reconfigure, rename and remove an existing tab by clicking the drop down arrow alongside the tab. 要重新配置选项卡，请选择“设置”…

阅读更多...

网络安全：腾讯云智、绿盟、美团、联想的面经

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 《Java代码审…

阅读更多...

【用Java学习数据结构系列】用堆实现优先级队列

【用Java学习数据结构系列】用堆实现优先级队列

看到这句话的时候证明：此刻你我都在努力加油陌生人个人主页：Gu Gu Study 专栏：用Java学习数据结构系列喜欢的一句话： 常常会回顾努力的自己，所以要为自己的努力留下足迹喜欢的话可以点个赞谢谢了。作者&#xff…

阅读更多...

如何在Java中实现用户列表的下载功能

如何在Java中实现用户列表的下载功能

在现代的Web应用中，用户管理是一个常见的需求。用户可能需要查看和下载他们的个人信息或者用户列表。本文将介绍如何使用Java和Spring框架实现用户列表的下载功能，具体采用Excel格式。一、项目准备首先，确保你的项目中已经引入了Spring B…

阅读更多...

力扣 42.接雨水

力扣 42.接雨水

文章目录题目介绍解法题目介绍解法法一：通过计算每个位置 i 能够捕获的雨水量，然后将他们相加。具体做法是：创建两个数组：preMax 和 sufMax 分别用来存储每个位置左边和右边的最大高度，则每个位置 i 可以捕获的…

阅读更多...

推荐文章

最新文章