datawhale AI夏令营第五期 深度学习入门 Task1 了解机器学习

news2024/12/23 1:51:41

机器学习基础

定义

学习一般是只有人才具备的能力,机器学习就是通过某种方式让机器具备人才有的学习能力,这里的某种方式是机器具备找一个函数的能力

比如说证件照背景颜色更换,那么机器需要找到图片中的背景在哪里,再替换成目标背景颜色
即输入是图片,输出也是图片

回归

即输出是数值,就比如说预测一下下个星期一的温度,这个就是一个数值(标量)

分类

即从给出的选项中选出一个作为输出,比如说判断一张图片是否是AI生成的,选项就只有两个,是或者不是

结构化学习

即输出一个有结构的物体,就比如文生图

案例

以视频的点击次数预测为例,听说过微信视频赚钱把,就是流量曝光

假设后台可以看到如下信息

  1. 每天点赞的人数
  2. 订阅的人数
  3. 观看次数

现在要找到一个函数,该函数的输入是后台的信息,输出是次日所有的总观看的次数

step 1: 写出函数表达式

假设是一次函数

y = w x 1 + b y = wx_{1}+b y=wx1+b

  • y是今天总共的观看次数
  • x 1 x_{1} x1是这个频道的昨天的总共观看次数

已知 y和 x 1 x_{1} x1,找b和w,当然不是让你瞎找,瞎猜,要合理的猜测,就这个而言,提出一个猜想

设今天的观看次数是today,昨天的观看次数是yesterday, 再加上一个修正值 adjust,因为事实可能是和我们的猜想一致,但存在一定差异,得到下面的
t o d a y = y e s t e r d a y × w + a d j u s t today = yesterday \times w +adjust today=yesterday×w+adjust
这个和之前的 y = w x 1 + b y = wx_{1}+b y=wx1+b一致,w称之为权重,b称之为偏置

  • 模型:含有未知的参数,机器学习中就是一个带有未知的参数的函数
  • 特征:即再函数中已知的信息,来自后台的信息

steps2: 定义损失

这里的损失可以理解为预测结果与实际结果之间的差距
由于需要根据已有的东西去猜测未知的东西,那么如何定义这一组数值优劣情况呢?答案是用函数来定义
在这里插入图片描述

y = w x 1 + b y = wx_{1}+b y=wx1+b

  • y是今天总共的观看次数
  • x 1 x_{1} x1是这个频道的昨天的总共观看次数

假设w=1,b=200
那么将2017年1月1日的观看次数代入得
y ′ = 200 + x 1 y^{'}=200+x_{1} y=200+x1,将 x 1 = 4800 x_{1}=4800 x1=4800代入得 y ′ = 200 + 4800 = 5000 y^{'}=200+4800=5000 y=200+4800=5000,但真实得结果是4900,那么预测结果与真实结果直接的差值是100(记作 e 1 e_{1} e1),以此类推,用1月2日的值来预测1月3日的值,值是5100,差值为2400(记作 e 2 e_{2} e2),依次类推,将三年的误差算出来,再算一个平均值,公式如下
L = 1 N ∑ n e n L=\frac{1}{N}\sum\limits_{n}^{}e_n L=N1nen

  • N是代表训练数据的个数,三年就是365*3
  • L是每一笔训练数据的误差e相加后的结果,L越大,就代表这一组参数越不好,L越小则代表这一组参数越好

估测预测的值与实际值之间的差距方法如下

  • 平均绝对误差 ( M e a n   A b s o l u t e   E r r o r , M A E ) 平均绝对误差(Mean\ Absolute\ Error,MAE) 平均绝对误差(Mean Absolute Error,MAE): e = ∣ y ′ − y ∣ e=|y^{'}-y| e=yy
  • 均方误差 ( M e a n   S q u a r e d   E r r o r , M S E   e = ( y ′ − y ) 2 均方误差(Mean\ Squared \ Error,MSE\ e=(y^{'}-y)^{2} 均方误差(Mean Squared Error,MSE e=(yy)2

这个交叉熵还在看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2076968.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pandas操作Excel文件

pandas操作Excel文件 一、前言二、指定读取的工作表与header设置2.1指定工作表2.2header设置 三、读取Excel数据3.1iloc读取数据3.2read_excel读取数据3.3loc读取数据 四、DataFrame数据筛选4.1根据列标签对整列进行筛选4.2使用iloc对区域进行筛选4.3自定义筛选 五、DataFrame类…

2024年8月26日(线上考试系统,虚拟化技术部署,使用link)

[rootdocker ~]# systemctl start docker [rootdocker ~]# docker pull mysql 一、线上考试系统 虚拟化技术部署 1、部署前端服务器 project_exam_system.sql数据库文件 dist网络资源 1.将资源上传到服务器 C:\Users\89765>scp -r "D:\青岛实训\project_exam_system\d…

C语言典型例题52

《C程序设计教程(第四版)——谭浩强》 题目: 例题4.4 相传古代印度国王舍罕要褒奖他聪明能干的宰相达依尔(国际象棋发明者),问他需要什么,达依尔回答说:“国王只要在国际象棋的棋盘的…

Shader 中的渲染顺序

1、深度测试和深度写入 有了深度测试和深度写入发挥作用让我们不需要关心不透明物体的渲染顺序比如一个物体A 挡住了 物体B,即使底层逻辑中 先渲染A,后渲染B,我们也不用担心 B的颜色会把A覆盖,因为在进行深度测试时,远…

电池管理系统SOX算法资料优化目录2024.8.26

这篇文章主要写一下这一次更新的几个地方,有对原来的代码及模型进行优化的部分,也有新增加的代码和模型,我就把几个比较典型的给列了出来。但是还有好多的更新没有在下面展示出来,因为一个个展示出来太复杂了。如果你对更新的内容…

如何使用ssm实现基于 SSM 框架的宠物用品电子商务平台设计与实现+vue

TOC ssm258基于 SSM 框架的宠物用品电子商务平台设计与实现vue 绪论 1.1 研究背景 当前社会各行业领域竞争压力非常大,随着当前时代的信息化,科学化发展,让社会各行业领域都争相使用新的信息技术,对行业内的各种相关数据进行科…

黑神话悟空妖怪平生录

黑神话悟空是一部特别好玩的单机游戏。上一个我这么喜欢的国产单机还是古剑奇谭三。 虽然黑神话的战斗系统和地图系统尚不完善,但是这里面的游记是真的做得很认真。 203个妖怪,203首小诗,203个妖生故事,带你去看妖怪的喜怒哀乐。…

freemarker模版注入

Freemarker模版注入漏洞 模版注入漏洞根因(SSTI,服务器端模版注入)freemarker介绍Freemarker模版注入漏洞关键点漏洞复现环境引入依赖poc 修复方案完整代码(包含修复)参考 模版注入漏洞根因(SSTI&#xff0…

乾坤大挪移--将一个混乱的excel分类整理的辅助VBA代码

excel 乾坤大挪移 你不需要将工作表手动分类; 只需要在”已整理“的标题行增加标题列, listbox会自动获取”已整理“sheet中的标题列,并列出来 你只需要选中同一列中的单元格,点击想移动到的列表的类别,双击或者点…

【云故事探索】NO.7:「越用越上瘾」,中华财险 60% 研发人员用通义灵码提效

云布道师 中华联合财产保险股份有限公司运用“云大模型”技术革新业务,通过阿里云的通义灵码大幅提升编码效率,近60%的研发人员采用,采纳的生成代码占比约20%,显著提升了团队创新能力与代码质量,并积极探索大模型在更多…

基于SpringBoot的智慧党建系统+uniapp移动端+LW示例参考

1.项目介绍 技术栈环境:SpringBootthymeleafuniappIDEA NavicatMySQL 功能介绍: 后端功能:首页管理(轮播图、通知公告、新闻管理)、用户管理(用户信息、用户反馈、用户订单、用户动态)、其他…

一文搞定MybatisPlus

Mybatis简介 MyBatis-Plus(简称 MP)是一个 MyBatis 的增强工具,在 MyBatis 的基础上只做增强不做改变,为简化开发、提高效率而生。 (来自官网) 体验Mybatisplus 1.创建SpringBoot工程,导入m…

HarmonyOS--认证服务-操作步骤

HarmonyOS–认证服务 文章目录 一、注册华为账号开通认证服务二、添加项目:*包名要与项目的包名保持一致三、获取需要的文件四、创建项目:*包名要与项目的包名保持一致五、添加json文件六、加入请求权限七、加入依赖八、修改构建配置文件:bui…

【UDS诊断】——0x34、0x36、0x37服务

🙋‍♂️【UDS诊断服务介绍合集】系列💁‍♂️点击跳转 文章目录 一、服务概述1.0x34服务——请求下载数据1.1.0x34格式 2.0x36服务——数据传输2.1.0x36格式 3.0x37服务——退出上传下载3.1.0x37格式 一、服务概述 Client端使用Routine Control服务来…

WIN32实现远程桌面监控

文章目录 完整代码API简介调试代码 后记reference 完整代码 server.cpp #include <winsock2.h> #include <Ws2tcpip.h> #include <windows.h> #include <stdio.h> #include <vector> #pragma comment(lib, "ws2_32.lib")LRESULT CAL…

什么是韦恩图,怎么制作?用这款软件在线绘制,简单又好用!

在日常工作和学习中&#xff0c;我们经常需要用图表来可视化呈现复杂的信息和关系。其中&#xff0c;韦恩图是一种简洁而强大的可视化工具&#xff0c;能够清晰地展现集合之间的关系&#xff0c;诸如包含与被包含、互斥、并列等。 不过对刚接触韦恩图的人而言&#xff0c;或多…

traceroute命令这样用,追踪主机路由没烦恼

号主&#xff1a;老杨丨11年资深网络工程师&#xff0c;更多网工提升干货&#xff0c;请关注公众号&#xff1a;网络工程师俱乐部 晚上好&#xff0c;我的网工朋友。 网络的稳定性和可靠性对于业务连续性至关重要。当涉及到网络连接问题时&#xff0c;有一个强大的工具就是 tr…

Certum Domain Validation CA SHA2

Certum是波兰的一家数字证书厂家&#xff0c;该机构也是目前世界第四家兼容性在99%机构&#xff08;包括历史版本浏览器&#xff09;&#xff0c;目前在国内有授权提供商&#xff1a;Gworg提供签发和认证&#xff0c;拥有二级代理划分&#xff0c;适合长期做SSL证书业务或者集成…

年薪100K入职字节测试岗现在分享下我常背的软件测试面试题

800道软件测试面试真题&#xff0c;高清打印版打包带走&#xff0c;横扫软件测试面试高频问题&#xff0c;涵盖测试理论、Linux、MySQL、Web测试、接口测试、APP测试、Python、Selenium、性能测试、LordRunner、计算机网络、数据结构与算法、逻辑思维、人力资源等模块面试题&am…

Linux文件编程(系统API调用)

文章目录 Linux文件编程标注C的IO缓存类型代码示例--缓存区的存在 文件I/O系统调用标准C库关于文件的输入输出函数FILE结构体文件描述符文件描述符与文件指针的相互转换 系统调用常用函数open函数&#xff08;打开或者创建文件&#xff09;creat函数&#xff08;创建一个现有文…