Datawhale X 李宏毅苹果书 AI夏令营 入门 Task1-机器学习

news2024/11/13 12:48:08

目录

  • 机器学习基础
  • 案例分析-视频的点击次数预测
    • 机器学习流程
    • 相关公式

机器学习基础

机器学习:机器具备有学习的能力/让机器具备找一个函数的能力。比如语音识别、图像识别、

机器学习有不同的类别。
1)回归:假设要找的函数的输出是一个数值/标量,这种机器学习的任务称为回归。
2)分类:分类任务要让机器做选择题。人类先准备好一些选项,这些选项称为类别。
3)结构化学习:机器不只是要做选择题或输出一个数字,而是产生一个有结构的物体,比如让机器画一张图,写一篇文章。这种叫机器产生有结构的东西的问题称为结构化学习。

案例分析-视频的点击次数预测

机器学习流程

1)构建模型
写出一个带有未知参数的函数(模型),用于预测未来观看次数。
例如, y = b + w x 1 y = b + wx_1 y=b+wx1,其中 y 是预测的观看次数, x 1 x_1 x1 是前一天的观看次数,b 和 w 是未知参数。
其中,带有未知的参数的函数称为模型。特征 x 1 x_1 x1是这个函数里面已知的,而 w 跟 b 是未知的参数。w 称为权重,b 称为偏置。
2)定义损失函数
损失函数用于评估模型预测值与实际值之间的差异。
例如,如果 b = 500 和 w = 1,则预测函数为 y = 500 + x 1 y = 500 + x_1 y=500+x1
计算每一条记录的预测值与实际值之间的差距,并求平均值得到损失。
3)最优化
使用梯度下降算法来调整模型参数,以最小化损失函数。
初始参数随机选取,然后根据损失函数的梯度来更新参数。
更新规则为: w 1 ← w 0 − η ∂ L / ∂ w ∣ w = w 0 w1 ← w0 - η ∂L/∂w | w=w_0 w1w0ηL/ww=w0,其中 η 是学习率。
梯度下降过程中可能遇到局部最小值,但这通常不是一个严重的问题。
4)结果
在训练数据上找到了最佳参数 w* = 0.97, b* = 100。
使用这些参数得到的平均误差约为 480。
在未见过的数据上(2021年的数据),模型的误差为 0.58。

相关公式

1.模型公式:
在这里插入图片描述
2.损失函数
在这里插入图片描述

3.参数更新
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2080530.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

密码学(二)---DES、SM、RSA

在使用本博客提供的学习笔记及相关内容时,请注意以下免责声明:信息准确性:本博客的内容是基于作者的个人理解和经验,尽力确保信息的准确性和时效性,但不保证所有信息都完全正确或最新。非专业建议:博客中的…

【网络安全】服务基础第一阶段——第四节:Windows系统管理基础---- NTFS安全权限与SMB文件共享服务器

目录 一、NTFS安全权限 1.1 文件系统 1.2 格式化磁盘中的文件系统 1.FAT32 2.NTFS 3.EXT 4.XFS 应用场景: 1.3 文件操作权限 1.4 权限管理系统 1.5 特殊权限 1.6 NTFS权限类型 二、权限管理实践 三、SMB文件共享服务器 3.1 文件共享服务器 3.2 常用的…

excel规划求解结合vba宏笔记

目录 概念与配置 规划求解定义 excel设置规划求解 宏的基本操作 excel批量进行规划求解案例 加载规划求解模块 宏的设置 宏录制vba 其他案例 概念与配置 规划求解定义 运用“规划求解”定义并求解问题 - Microsoft 支持 excel设置规划求解 EXCEL规划求解的简明教程…

OpenAI的GPT-4模型详细介绍:研发能力、应用场景、开发的合作、持续投入

Open AI GPT-4的详细介绍 OpenAI的GPT-4模型展现出了强大的研发能力: 这主要体现在以下几个方面: 1. 庞大的模型规模和参数数量 GPT-4拥有超过1万亿个参数,这是其前代模型GPT-3的显著扩展。如此庞大的模型规模使得GPT-4能够处理更为复杂…

如何从人机环境系统中捕捉语义

从人机环境系统中捕捉语义主要涉及将系统中的数据和信息转化为具有实际意义的内容,以便更好地理解和响应用户的需求。以下是几种常见的方法来捕捉语义: 1. 自然语言处理 (NLP) 方法:使用自然语言处理技术来分析和理解用户输入的文本或语音。N…

8.27-dockerfile的应用+私有仓库的创建

一、dockerfile应用 通过dockerfile创建⼀个在启动容器时,就可以启动httpd服务的镜像 1.步骤 : 1.创建⼀个⽬录,⽤于存储Docker file所使⽤的⽂件2.在此⽬录中创建Docker file⽂件,以及镜像制作所使⽤的⽂件3.使⽤docker build创建镜像4.使…

MySQL集群技术3——MySQL高可用之组复制

MySQL高可用之组复制 MySQL Group Replication(简称 MGR )是 MySQL 官方于 2016 年 12 月推出的一个全新的高可用与高扩 展的解决方案 组复制是 MySQL 5.7.17 版本出现的新特性,它提供了高可用、高扩展、高可靠的 MySQL 集群服务 MySQL 组复制分单主模式和多主模式…

大数据-104 Spark Streaming Kafka Offset Scala实现Redis管理Offset并更新

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…

IngsollRang拧紧Insight IC-D控制器维修 系统参数设置

——设置菜单 Setup(设置)菜单及其子菜单用于编写拧紧策略并设置许多重要的系统参数。 在Setup(设置)菜单中,创建基本拧紧策略。 除策略外,您可以使用Setup(设置)菜单来设置时间、显…

堆和栈的概念和区别

文章目录 堆和栈的概念和区别栈 (Stack)堆 (Heap)详细描述补充说明逃逸分析 (Escape Analysis)栈上分配 (Stack Allocation)堆碎片化 (Heap Fragmentation) 堆和栈的概念和区别 堆和栈的概念和区别【改编自博客】 在说堆和栈之前,我们先说一下JVM(虚拟…

家里两个路由器IP地址一样吗?‌IP地址冲突怎么办?‌

在家庭网络环境中,‌随着智能设备的不断增多和网络需求的日益提升,‌很多家庭选择使用两个或更多的路由器来扩展网络覆盖、‌提高网络性能。‌然而,‌在设置和使用多个路由器的过程中,‌一个常见且令人困惑的问题是:‌…

C++常见面试题(面试中总结)

文章目录 原文章链接1、回调函数的了解?2、递归算法解释?3、内存对齐解释?4、一种排序算法解释(快速排序)5、什么是多态?6、基类为什么需要虚析构函数?7、new和malloc的区别?8、指针…

ubuntu中安装Mysql以及使用Navicat远程连接的详细步骤【图文教程】

安装步骤 注意:建议大家都安装Ubuntu22.04的版本,在该版本下再安装MySQL8.0版本的数据库。 1查看当前是否安装了MySQL程序 $ dpkg -l |grep mysql 执行以上命令,如果执行后什么都没有,则进入到MySQL的安装步骤 2如果执行以上…

MATLAB进阶:应用微积分

今天我们继续学习matlab中的应用微积分 求导(微分) 1、数值微分 n维向量x(xi,x,… x)的差分定义为n-1维向量△x(X2-X1,X3-X2,…,Xn- Xn-1)。 diff(x) 如果x是向量,返回向量x的差分如果x是矩…

初识Linux · 有关gcc/g++

目录 前言: 1 gcc和g 2 翻译过程 2.1 预处理 2.2 编译 2.3 汇编 2.4 链接 前言: 继上文介绍了vim 和 yum,相当于介绍了 文本编译器,我们可以利用vim写代码,那么写代码的我们了解了,现在应该了解编译…

R语言统计分析——如何选择最佳回归模型

参考资料:R语言实战【第2版】 尝试获取一个回归方程时,实际上你就面对着从众多可能的模型中做选择的问题。是不是所有的变量都要包括?还是去掉那个对预测贡献不显著的变量?是否需要添加多项式项和/或交互项来提高拟合度&#xff1…

.NET WPF 抖动动画

.NET WPF 抖动动画 Demo Code <!-- 水平抖动 --> <Button Content"Hello World"><Button.RenderTransform><TranslateTransform x:Name"translateTransform" /></Button.RenderTransform><Button.Triggers><Even…

SP: eric

靶机搭建 靶机下载地址 在Virtualbox中打开下载好的靶机&#xff0c;网络配置修改为桥接模式&#xff0c;启动靶机即可。 信息收集 主机发现 nmap 192.168.31.0/24 -Pn -T4 靶机IP&#xff1a;192.168.31.244 端口扫描 nmap 192.168.31.244 -A -p- -T4 根据端口扫描结果…

Linux驱动学习之内核poll阻塞

在linux系统编程课程中学习过多路IO复用&#xff0c;简单来说就三个函数select&#xff0c;poll&#xff0c;epoll。 对于select 此函数是跨平台的&#xff0c;可以在windows&#xff0c;Linux中使用。 对于poll与epoll 只能在linux平台下使用&#xff0c; epoll底层实现是一个…

ArcGIS应用指南:近邻分析(点匹配到最近线段上)

近邻分析通常用于确定一个要素集中的要素与另一个要素集中最近要素的距离。当涉及到点匹配到最近的线时&#xff0c;这种分析可以用来确定每个点到最近线段的距离及位置&#xff0c;也就是我们常说的点匹配到最近线上&#xff0c;可以参考官方文档&#xff1a;近邻分析 (Covera…