【ML】 基本概念

news2024/9/19 19:35:44

ML 基本概念

    • 1. different types of functions
    • 2. how to find the function - training data
    • 3. unseen during training
    • 4. Back to ML Framework
      • 4.1 Step1: function with unknown
      • 4.2 Step2: define loss from training data
      • 4.3 step3: optimization
      • 4.4 其他
        • 4.4.1 Sigmoid → ReLU
        • 4.4.2 more variety of models
    • 5. 神经网络 → 深度学习?!

Machine Learning ~ looking for function

1. different types of functions

  • Regression: output a scalar

  • Classification: classes → correct one

  • 黑暗大陆:structured learning - 创造

2. how to find the function - training data

  1. function with unknown parameters - Model
    y = b + w x 1 y = b+wx_1 y=b+wx1
    based on domain knowledge

    w and b are unknown parameters(learned from data)

    x1 - features

    w - weight

    b - bias

  2. Define Loss from Training data

    Loss is a function of parameters. Loss means how good a set of values is.
    L ( b , w ) = Σ 1 n e n L(b,w)=\Sigma\frac{1}{n}e_n L(b,w)=Σn1en
    e: 预计值与真实值(Label)间的差距,计算方法很多

    • MAE: mean absolute error
      y = ∣ y − y ^ ∣ y = |y-\widehat{y}| y=yy

    • MSE: mean square error

  3. Optimization

    Gradient Descent

    image-20230103161403776
    • hyperparameters

    直到微分为0或你已经失去耐心

    问题非常明显:并未找到真正的global minima而是停留在一个Local minima.

    但事实上,Local minima是个伪命题,后续详谈。

    推广至两个参数:

    image-20230103161906471

    直观来看

    image-20230103162128862

3. unseen during training

观察到7天一循环 于是

image-20230103172614074

这样的模型叫做Linear models. 这样简单的线性关系有Model Bias,我们需要更flexible的模型

All piecewise linear curves =

image-20230104165211017

piecewise linear curve(hard Sigmoid)可以用来逼近continuous curve

image-20230104170421424

x1趋近正无穷,y趋近于c;x趋近于负无穷,y趋近于0.

不同的w c b造出不同的sigmoid function,叠加出复杂的piecewise linear curve,从而逼近各种曲线

image-20230104170810137

于是我们可以通过如下含有不同参数的公式,来逼近

image-20230104171037737

推广至多天(more features)

image-20230104190306798

4. Back to ML Framework

4.1 Step1: function with unknown

每个 i 表示蓝色的function(hyperparameter),j表示features

image-20230104191400806

image-20230104191600846

image-20230104191803146

image-20230104191847102

综上,用线性代数的矩阵表示

image-20230104192025743

把unknown parameters拉直拼成一个长向量

image-20230104192538112

4.2 Step2: define loss from training data

只不过现在Loss的参数多了
L ( θ ) L(\theta) L(θ)
Loss means how good a set of values is.

image-20230104193746002

4.3 step3: optimization

gradient 求梯度,并更新参数

image-20230104194549272

image-20230104194733599

直到不想做了/得到零向量(实际上不太可能)

image-20230104195044320

至于为什么要分成一个一个的batch(多少个也是hyperparameter),后续详谈

4.4 其他

4.4.1 Sigmoid → ReLU

两个ReLU叠加起来成为一个Hard sigmoid

image-20230104200123169

image-20230104200404439

(max效果较好,原因以后详谈)

4.4.2 more variety of models

反复多做几次(几次,又是一个hyperparameter)

image-20230104200914251

5. 神经网络 → 深度学习?!

image-20230105202441532

image-20230105202533671

overfitting: Better on training data, worse on unseen data.

image-20230105203027836

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/142088.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基础算法(五)——双指针算法

双指针算法 介绍 双指针算法分为两大类: 两个指针指向两个不同序列,用两个指针维护某一种逻辑,例如归并排序 两个指针指向一个序列,即用两个指针维护一段区间,例如快排 核心思想: 若能证明出题目存在…

Linux工具学习之【vim】

✨个人主页: Yohifo 🎉所属专栏: Linux学习之旅 🎊每篇一句: 图片来源 🎃操作环境: CentOS 7.6 阿里云远程服务器 Whatever is worth doing is worth doing well. 任何值得去做的事情&#xff0…

springboot垃圾分类查询管理系统

1.介绍 垃圾分类查询管理系统,对不懂的垃圾进行查询进行分类并可以预约上门回收垃圾。 让用户自己分类垃圾, 按国家标准自己分类, 然后在网上提交订单, 专门有人负责回收, 统一回收到垃圾处理站, 然后工人…

Renesas 3 --烧写

1.烧录Boot程序 1.1,连接RESET_OUT, TOOL0, GND到板子。 1.2,上电后烧录器上指示灯亮(假如不亮,重新上电烧录器) 1.3,用Renesas flash programmer来烧写软件(新建项目,然后保存项目…

RAW怎么转为JPG?这些转换技巧值得收藏

相信大多数的人,出去外面游玩时都喜欢使用相机来拍照,但是大多数相机拍出来的照片都是RAW格式,图片传到电脑时,会因为格式的不兼容而导致无法查看,这个时候我们就需要把图片的格式进行转换,例如我们将其转换…

Day850.GuardedSuspension模式 -Java 性能调优实战

GuardedSuspension模式 Hi,我是阿昌,今天学习记录的是关于GuardedSuspension模式的内容。 小灰工作中遇到一个问题,开发了一个 Web 项目:Web 版的文件浏览器,通过它用户可以在浏览器里查看服务器上的目录和文件。 这…

(原创)Flow数据流的使用

前言 这篇文章主要介绍Flow的一些基础使用方法 同时介绍如何用Flow请求网络数据 下面开始! 什么是Flow Flow翻译过来,是“流”的意思 举例说明,在大自然中,常见的如水流 是从高往低流动的 那么在计算机世界里,所谓的…

loss盘点: asl loss (Asymmetric Loss) 代码解析详细版

1. BCE公式部分 可以简单浏览下这篇博客的文章: https://blog.csdn.net/qq_14845119/article/details/114121003 这是多分类 经典 BCELossBCELossBCELoss 公式 L−yL−(1−y)L−L -y L_{} - (1-y) L_{-} L−yL​−(1−y)L−​ 其中,L/−L_{/-}L/−​…

Docker保姆级学习教程

文章目录1、什么是Docker1.1、容器技术1.2、容器与虚拟机比较1.3、Docker特点1、更高效的利用系统资源2、更快速的启动时间3、一致的运行环境4、持续支付和部署5、更轻松的迁移6、更轻松的维护和扩展2、Docker组件学习2.1、Docker客户端和服务器2.2、Docker镜像2.3、Registry&a…

奇怪的知识——Windows下怎么修改进程的名称?

📢欢迎点赞 :👍 收藏 ⭐留言 📝 如有错误敬请指正,赐人玫瑰,手留余香!📢本文作者:由webmote 原创📢作者格言:无尽的折腾后,终于又回到…

element-plus的form表单form-item的prop怎么写才能正确校验,实现逻辑是怎么样的?

不管是element-plus还是上一个版本的element-ui,都是一个使用很广泛的基于csshtmljs的ui组件库,它的form表单自带强大的校验功能,form-item的prop怎么写才正确,实现逻辑是怎么样的?element-plus的form表单的model、for…

聚观早报 | 苹果市值跌破2万亿美元大关;卢伟冰晋升小米集团总裁

今日要闻:苹果市值跌破2万亿美元大关;卢伟冰晋升小米集团总裁;京东方拿下iPhone 15订单;英伟达与富士康达成合作;哪吒汽车旗下车型价格调整苹果市值跌破2万亿美元大关 1 月 4 日消息,据国外媒体报道&#x…

C51单片机连接wifi模块,发送AT指令

一、AT指令AT 指令集是从终端设备( Terminal Equipment , TE) 或 数据终端设备 ( Data TerminalEquipment , DTE) 向终端适配器 (Terminal Adapter , TA) 或 数据电路终端设备 (Data CircuitTerminal Equipment &#…

CDGA|企业数字化转型进展得越快就越好吗?

数据治理并不是一件简单的事情。即使是行业知名公司,在高度重视和确保投入的情况下,完成全公司“数据底座”/“数据中台”的所耗时间也往往以年计。并且,还需要注意到,数据规范只是数字化转型的一个维度而已: 在国标《…

SQL INSERT INTO 语句

INSERT INTO 语句用于向表中插入新记录。 SQL INSERT INTO 语句 INSERT INTO 语句用于向表中插入新记录。 SQL INSERT INTO 语法 INSERT INTO 语句可以有两种编写形式。 第一种形式无需指定要插入数据的列名,只需提供被插入的值即可: INSERT INTO t…

Python爬虫常用哪些库?

经常游弋在互联网爬虫行业的程序员来说,如何快速的实现程序自动化,高效化都是自身技术的一种沉淀的结果,那么使用Python爬虫都会需要那些数据库支持?下文就是有关于我经常使用的库的一些见解。 请求库: 1、urllib&a…

matlab复杂函数多元函数拟合

简介 本文介绍了基于matlab实现的复杂函数以及多元函数的拟合。在工程和研究中偶尔会遇到要用一个非常复杂的数学公式来拟合实验测量数据,对这些复杂的数学公式拟合时,采用常见的拟合方法往往会失败,或者得不到足够精确的结果。本文以笔者多…

AVL树:高度平衡的二叉搜索树

AVL树 AVL树和BST树的联系   答:BST树(二叉排序树)当节点的数据key有序时是一棵单支树,查找时效率直接降低到O(N)而不是树高,为了使树尽量两边均匀,设计出了AVL树,AVL树的左右高度差不超过1。…

sql语句练习题1

1、选择部门30中的所有员工; 要注意到查的是所有员工 代码如下: mysql> select * from emp where deptno 30;2、列出所有办事员(CLERK)的姓名,编号和部门编号; 注意的是要查的是姓名,编号和部门编号 范围限定的是…

并发编程的原子性 != 事务ACID的原子性

△Hollis, 一个对Coding有着独特追求的人△这是Hollis的第 412 篇原创分享作者 l Hollis来源 l Hollis(ID:hollischuang)关于原子性,很多人在多个地方都听说过,大家也都背的很熟悉。在事务的ACID中,有原子性…