【Datawhale夏令营】任务三学习笔记

news2025/1/21 9:26:04

acff8ed52629488e89b6f666cd4a247e.gif

                          任务一笔记回顾

                          任务二笔记回顾

acff8ed52629488e89b6f666cd4a247e.gif

目录

一:竞赛上分流程

1.1问题建模1.2数据分析

1.3数据清洗1.4特征工程

1.5模型训练与验证

二:任务总结与心得


 

一:竞赛上分流程

8b8788e0b6934e50abcf740696082e7c.jpeg

问题建模——>数据分析 ——>数据清洗——>特征工程——>模型训练与验证——>模型预测

1.1问题建模

fde23f88ae9343aa9fbe25e59373374c.jpeg

 

1.2数据分析

f2d07d666b7f462e80b67ed4c3217fb2.jpeg

 

1.3数据清洗

  1. 数据审查:首先,查看数据集的整体结构和特征。了解数据的格式、类型、缺失值、异常值等信息。

  2. 处理缺失值:检查数据集中是否存在缺失值。可以选择删除包含缺失值的行或列,或者使用恰当的方法填充缺失值,比如用均值、中位数或者使用插值算法填充。

  3. 处理异常值:检测并处理异常值,这些异常值可能会对分析结果产生显著影响。可以使用统计方法,比如计算离群值或使用箱线图,或者应用领域知识和专业判断来处理异常值。

  4. 数据类型转换:检查数据的类型是否正确,并根据需要进行类型转换。例如,将字符串类型转换为数值类型,或者将日期和时间类型转换为标准格式。

  5. 数据去重:检查数据集中是否存在重复的数据行或列,并根据需要删除重复项,以确保数据的唯一性。

1.4特征工程

(1)交叉特征:主要提取流量、上部温度设定、下部温度设定之间的关系;

(2)历史平移特征:通过历史平移获取上个阶段的信息;

(3)差分特征:可以帮助获取相邻阶段的增长差异,描述数据的涨减变化情况。在此基础上还可以构建相邻数据比值变化、二阶差分等;

(4)窗口统计特征:窗口统计可以构建不同的窗口大小,然后基于窗口范围进统计均值、最大值、最小值、中位数、方差的信息,可以反映最近阶段数据的变化情况。
e7f344ac67f0499984ffba17af643c15.jpeg


 

1.5模型训练与验证

63b0e8b3bdcb444a962e6ccb0b758f02.jpeg

 


 

二:任务总结与心得

b1f094acae1a405ead3fb1682f29f680.png

 

2.1      baseline进行修改优化后并跑通,结果可观如下:

313df650a89046a39e915ec317147212.png

2.2      调整参数后: 

483b4094cccf43029d347d46d2008e64.png

 

参考文章:

datawhale暑期夏令营:datawhale开源项目

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/813030.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ERROR: AddressSanitizer: heap-buffer-overflow on address 0x602000000

leetcode上的一道题,当 s “a” 这样的单字符的时候,使用memset会出错,ERROR: AddressSanitizer: heap-buffer-overflow on address 0x602000000。 有些奇怪, 记录一下,双字符以及以上的时候不会报错,

Spring注解开发,bean的作用范围及生命周期、Spring注解开发依赖注入

🐌个人主页: 🐌 叶落闲庭 💨我的专栏:💨 c语言 数据结构 javaweb 石可破也,而不可夺坚;丹可磨也,而不可夺赤。 Spring注解开发 一、注解开发定义Bean二、纯注解开发Bean三…

MacOS Sonoma 14.0 (23A5301g) Beta4 带 OC 0.9.3 and FirPE 双分区原版黑苹果镜像

7月26日苹果发布macOS Sonoma Beta 4预览版更新,但部分用户在升级后遇到了各种问题。这一测试版目前还处于开发阶段,因此出现各种问题并不意外。 一、镜像下载: 1.微信公众号:MacOS Sonoma 14.0 (23A5301g) Beta4 带 OC 引导双分…

视频爬虫:解析m3u8文件 python m3u8库,m3u8文件中.ts视频流的解密下载

一、引用的库 这里需要引用的库是:from Crypto.Cipher import AES 有坑哈,python3.0之后直接安装crypto你会发现不管怎么着都会报错。 经过查找资料找到了原因,原来是20年之后crypto已经被pycryptohome替换掉啦, 如果之前安装过…

暴力破解(DVWA和pikachu)

目录 前言暴力破解模式一.pikachu靶场1.基于表单的暴力破解2. 验证码绕过2. token防爆破 二. DVWA1.low,Medium2.High3. Impossible 前言 渗透测试中暴力破解方法解释:通过尝试所有可能的字符组合来猜测密码的方法。 这种攻击方法需要大量计算资源和时间&#xff0…

人类文明进入下个纪元奇点:UFO听证会-恒温超导发现-GPT大模型

今年以来,科技领域出圈的事件频繁发生,每一个事件都意味着一个领域的重大突破的可能。这些事件是UFO听证会、恒温超导LK99的论文、GPT类大模型的广泛应用,我常将这些事件串在一起思考,细思极恐,一种”火鸡与农场主“的…

Vue(待续)

概念 一套用于构建用户界面的渐进式JavaScript框架 Vue可以自底向上逐层的应用: 简单应用:只需一个轻量小巧的核心库。 复杂应用:可以引入各式各样的Vue插件。 1.采用组件化模式,提高代码复用率、且让代码更好维护。 2.声明式编码,让编码人员…

使用Appuploader工具将IPA上传到App Store的最新流程和步骤

​ 苹果官方提供的工具xcode上架ipa非常复杂麻烦。用appuploader 可以在 mac 和windows 上制作管理 证书 ,无需钥匙串工具 条件:1.以Windows为例,创建app打包ios需要的证书和描述文件 2.准备好一个苹果开发者账号(如果没有到苹果…

C++ | unordered_map与unordered_set的用法指南

目录 前言 一、unordered_set 1、简介 2、构造相关函数 3、容量相关函数 4、修改与查找相关接口 5、迭代器 二、unordered_map 1、简介 2、构造相关函数 3、容量相关接口 4、迭代器、查找与修改相关接口 5、方括号接口 三、红黑树系列与哈希系列对比 前言 unorde…

SpringCloud(待续)

单体架构特点? 简单方便,高度耦合,扩展性差,适合小型项目。例如:学生管理系统 分布式架构特点? 松耦合,扩展性好,但架构复杂,难度大。适合大型互联网项目,例如:京东、淘宝 微服务:一种良好的分…

vue项目环境 搭建

1、安装nodejs 2、安装vue-cli, npm i -g vue/cli-init 3、初始化项目 vue init webpack test 4、运行 cd test npm run dev

【机器学习】西瓜书习题3.5Python编程实现线性判别分析,并给出西瓜数据集 3.0α上的结果

参考代码 结合自己的理解,添加注释。 代码 导入相关的库 import numpy as np import pandas as pd import matplotlib from matplotlib import pyplot as plt导入数据,进行数据处理和特征工程 得到数据集 D { ( x i , y i ) } i 1 m , y i ∈ { 0 ,…

python+opencv学习

1. 把所有绿色通道值变为0 import cv2 import numpy as npimgcv2.imread(2.jpg) #读取图片 img[:,:,1]0 #绿色通道变为0 cv2.imshow(图片,img) #显示图片 cv2.waitKey(0) #无限地显示窗口 人生建议,一定要买书来学习呀,不是说教程不好,而是书…

idea application.yml配置文件没有提示或读不到配置

1.首先确定你的resources文件夹正常且yml文件图表和下面一样 不一样的右键去设置 2.确保你已经缩进了且层级关系正常 3.如果以上都不是,先考虑删除.idea重开试试 4.以上解决不了就装以下两个插件解决

[深入理解NAND Flash] 闪存(NAND Flash) 学习指南

依公开知识及经验整理,付费内容,禁止转载。 所在专栏 《深入理解Flash:闪存特性与实践》 1. 我想和你说 漠然回首,从事存储芯片行业已多年,这些年最宝贵的青春都献给了闪存,虽不说如数家珍,但也算专业。 …

【Git】git reflog git log

前言 日常开发过程中,我们经常会遇到要进行版本回退的情况,这时候需要使用git reflog和git reset 命令 git reflog 常用命令: 1、git reflog -n 查看多少条 2、git reflog show origin 查看远程历史变动 git log 什么都不加默认显示当前分…

SpringBoot项目中的web安全防护

最近这个月公司对项目进行了几次安全性扫描,然后扫描出来了一些安全漏洞,所以最近也一直在修复各种安全漏洞,还有就是最近在备考软考高级系统架构设计师,也刚好复习到了网络安全这一个章节,顺便将最近修复的安全漏洞总…

漏洞利用-PoC-in-GitHub+msf简单利用

查找库-PoC-in-GitHub 里面集成了几乎所有cve漏洞 下载:https://github.com/nomi-sec/PoC-in-GitHub 演示: 如想要查找vulfocus靶场中 Metabase远程命令执行漏洞 的利用方法。 可以下载一个Yomm闪电文件搜索 Yomm闪电文件搜索下载:https://…

Github-Copilot初体验-Pycharm插件的安装与测试

引言: 80%代码秒生成!AI神器Copilot大升级 最近copilot又在众多独角兽公司的合力下,取得了重大升级。GitHub Copilot发布还不到两年, 就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。 …