2023大数据挑战赛全国六强团队获奖经验+ppt分享(四)

news2024/10/16 22:22:39

c262baabbf532aa8e46b76dadcd6b225.png

团队名称

陛下请移步至地下室

团队成员

张晓立(华东师范大学)

团队名次

全国第三名

赛题描述说明介绍

2023大数据挑战赛赛题说明+决赛评分标准回顾

参赛分享与收获

大赛提供了非常丰富有趣的数据,能把数据分析明白就能获得高分。首先分析metric数据中的故障特点,可以发现每一个tags都能组成一个长度为21的时间序列,因此metric中的故障主要表现为时间序列的异常。接下来分析trace的故障特点,从字段说明中可以知道status_code不等于200就代表故障。另外,span_time=end_time-start_time,即调用时长,调用时长过长或者过短都可能代表故障。timestamp的差分代表了前后两次调用结束时间的间隔,过长或过短都可能表示故障。特征工程的思路主要就是根据故障特点来进行特征构造。由于全是手工特征,很可能受到缺失值和分布偏移的问题导致线上线下的差距过大,所以缺失值过滤和训练集和测试集的同分布检验非常有必要,这个操作使得ab榜切换时没有shake太多分。

模型方面选择了4种模型,xgboost和lightgbm负责获得稳定高分,随机森林和极端随机树负责碰运气shake出更高的分数。集成方面选择了标准的stacking集成方法,为了增加不同模型预测结果的差异,还针对不同的模型使用了不同数量的特征。

所有模型的训练都采用了5折交叉验证,并且坚持trust your local cv的原则,没有过度拟合a榜。

由于时间关系很遗憾没有对数据进行更深入的挖掘,使用的模型也偏保守。从前排队伍的分享来看,对数据的挖掘还是比较重要的,有一些业务背景知识处理起数据会事半功倍。

最后感谢清华大学的邀请,让我有机会去北京参观,食宿方面准备得非常周到,必须点赞。

决赛答辩ppt分享

b972cf381026e4373c3ecab367172b1c.png

c924b437bd6f0ee0fabeeded7240e3ce.png

0fa4d9f24375d24677f78dc4016044ef.png

e75a638442c4ecd62f332ba06580f748.png

8052b01279b8ff5b29fcd2f64d7d4209.png

ec58502b27e7bff721862096c7010f76.png

0199a1bbbc31b9b68cf3648339213099.png

67a3c4728502e20f76924f8cd478a50a.png

b26604da80328c6d4c2cbdc19311fd5e.png

2ecda8cf25bc62570b8e330a33f9cab8.png

240989d5bb6b5ff188b6c7d407db25d3.png

ee45d0476837e0c733c9a5a253b192b9.png

893b3765bf583e3763f5bfc0744e94da.png

6d369c8c8404086099c85f1569fb825e.png

724bca5692bf0f8887fe19ec66f0460e.png

3b4419aea62464eefd8a23c0ce57f357.png

c3f3aaae33e8b80c5f2932c04a2f5cea.png

0ef51115b5272493662db5034246cf51.png

d2f47bfb122036bfab0968350b9933a0.png

ad5e97843ff58bfaa0e61efd1bc4e1ab.png

4dd48e42b8f896094ce65681200a1bac.png

b63e87aad95b7cc275dfaf8c09a7b8f6.png

3e23e25cbef3748bd2b770e17224d9eb.png

fbd88adf4f2a348e44f40fd9daf0a0e4.png

aaaf5c05ea2f654d2f116378e3cab269.png

编辑:文婧

校对:林亦霖

6320add1281f0dc896ddd75dad7fc716.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/992481.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Delphi、C# 和 TypeScript 之父 Anders Hejlsberg(安德斯·海尔斯伯格,海神)赶潮AI

自2022年11月ChatGPT横空出世,一波由AIGC引发的热潮轰轰烈烈持续传播。 全球各国政府及大型互联网企业都在积极布局人工智能解决方案,抢占人工智能高地,推动人工智能产业健康发展。 Delphi、C# 和 TypeScript 之父,位列Microsof…

口袋参谋:如何规避差评风险?一招让你实现宝贝0差评!

​作为卖家,不会还有人不知道差评的威力吧! 如果你宝贝销量大,差评率本身就低,偶尔一个差评可能影响不大。 但如果你是新宝贝上架,销量少的可怜,差评就是重磅炸弹,99.99%让店铺的评分绿得发亮…

git bash 常见场景用法

1.git 客户端 2.git 代码操作(下载、上传、删除、查看仓库地址) 下载代码: git clone 仓库路径 上传代码: git add git commit -m "注释" git push 删除代码: git rm [-r] 代码;git commit -m…

腾讯云新用户:定义、专属福利及优惠活动

在当今的数字化时代,云计算已成为企业和个人不可或缺的技术服务。腾讯云作为国内领先的云计算服务提供商,为新用户提供了一系列专属福利和优惠活动。本文将详细介绍腾讯云新用户的定义、专属福利和优惠活动,助力大家轻松上云! 一、…

基于Java+SpringBoot+Vue前后端分离高校专业实习管理系统设计和实现

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

Tomcat多实例 + Tomcat负载均衡、动静分离(Nginx联动)

多实例联动 一、Tomcat 多实例1.1 什么是Tomcat多实例?1.2 配置思路1.3 配置实现1.3.1 安装jdk1.3.2 安装tomcat1.3.3 配置 tomcat 环境变量1.3.4 修改端口号1.3.5 修改各 tomcat 实例中的 startup.sh 和 shutdown.sh 文件,添加 tomcat 环境变量1.3.6 启…

01_前端css编写的三种方式

前言 CSS的引入方式共有三种&#xff1a;行内样式、内部样式表、外部样式表 一、内联式引入 用法&#xff1a; 在元素上直接通过style属性进行设置css样式设置 示例&#xff1a; <h1 style"color:red;">style属性的应用</h1> <p style"font-si…

建站系列(五)--- 前端开发语言之HTML、CSS、JavaScript

目录 相关系列文章前言一、前端开发与后端开发二、前端语言简介&#xff08;一&#xff09;、HTML&#xff08;二&#xff09;、CSS&#xff08;三&#xff09;、JavaScript 三、学习指导&#xff08;一&#xff09;、开发环境&#xff08;二&#xff09;、第一个Hello&#xf…

【实训】“宅急送”订餐管理系统(程序设计综合能力实训)

&#x1f440;樊梓慕&#xff1a;个人主页 &#x1f3a5;个人专栏&#xff1a;《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》 &#x1f31d;每一个不曾起舞的日子&#xff0c;都是对生命的辜负 前言 大一小学期&#xff0c;我迎来了人生中的第一次实训…

4.6版本Wordpress漏洞复现

文章目录 一、搭建环境二、漏洞复现1.抓包2.准备payload3.发送payload4.检查是否上传成功5.连接payload 国外的&#xff1a;Wordpress&#xff0c;Drupal&#xff0c;Joomla&#xff0c;这是国外最流行的3大CMS。国内则是DedeCMS和帝国&#xff0c;PHPCMS等。 国内的CMS会追求大…

2023/9/8 -- C++/QT

作业 1> 自行封装一个栈的类&#xff0c;包含私有成员属性&#xff1a;栈的数组、记录栈顶的变量 成员函数完成&#xff1a;构造函数、析构函数、拷贝构造函数、入栈、出栈、清空栈、判空、判满、获取栈顶元素、求栈的大小 02stack.h: #ifndef __02STACK_H__ #define __…

​重生奇迹MU魔法师的装备属性​

魔法师的武器主要武器装备&#xff0c;主要分类为单手武器、双手武器、戒指、项链、盾牌、头盔、铠甲、护手、护腿、鞋子&#xff0c;玩家需要根据情况集齐这些装备。 智力果实以及体力果非常重要&#xff0c;在实战的时候非常实用。实获取途径一般是果实合成、宝藏&#xff0…

说说分布式系统容器化

继上一篇浅谈高并发分布式架构演进路径&#xff0c;单体服务完成分布式架构改造&#xff0c;转型为微服务。随着微服务数量的急剧增加&#xff0c;跨应用、跨系统的调用越来越多&#xff0c;调用关系和依赖关系日益复杂&#xff0c;这种复杂性增加了系统的设计、实施和维护的难…

Java并发基石——CAS是如何实现的?

目录 1. 什么是CAS&#xff1f; 2. Java中关于 CAS 的 API 在哪里&#xff1f; 3. CAS API方法和参数解析 4. CAS的底层实现 5. CAS是如何保证多核线程安全的&#xff1f; 6. CAS的缺点&#xff1f; 7. 如何避免ABA问题&#xff1f; 1. 什么是CAS&#xff1f; CAS的全程是…

动态库静态库对比

程序编译成可执行程序的过程 静态在连接阶段会把代码复制到可执行文件中 动态则不&#xff0c;而是打包一些信息进去&#xff0c;在执行的时候根据信息找到动态库执行 制作过程 静态库 动态库 优缺点 库比较小且更新慢的时候一般使用静态&#xff0c;反之则动态 静态库 …

七种 BeanDefinition,各显其能!

聚沙成塔&#xff01;不知不觉 Spring 源码已经连续更了两个月啦&#xff0c;视频也录制了不少了&#xff0c;对 Spring 源码分析感兴趣的小伙伴戳这里哦Spring源码应该怎么学&#xff1f;&#xff5e; 今天我们继续来看 Spring 源码中一个非常重要的概念&#xff1a;BeanDefi…

万物皆可连的腾讯轻联

文章目录 前言关于腾讯轻联小试牛刀新建流程配置逻辑组件配置连接器流程上线 其它功能核心能力总结 前言 工作中有这样一个需求&#xff0c;每周五下午三点定时给小组内成员发送邮件&#xff0c;邮件内容固定&#xff0c;主要作用是提醒大家记得发周报&#xff1b;其实这个需求…

iOS:解决Could not find a storyboard named ‘LaunchScreen.storyboard‘ in bundle NSBundle

打开项目的&#xff1a;HBuilder-uniPlugin-Info.plist 删除Launch screen interface file base name 然后看图&#xff0c;清空掉之前的LaunchScreen.storyboard东西 再运行就可以了&#xff0c;我也是改自定基座出的问题略

西门子LAD编程扫描周期带来的步序跳转问题

一、程序目的 按一下启动&#xff0c;程序进入第一步。延时五秒之后进入第二步进行自加1&#xff0c;然后回到第一步继续延时5秒循环&#xff0c;依次类推。 二、出现的问题 第一次程序进入第一步时&#xff0c;定时器正常定时&#xff0c;计数正常加1&#xff0c;但从第二轮开…

使用WinDbg进行动态调试

前言 本文章主要介绍如何使用WinDbg进行动态调试。如果程序崩溃后&#xff0c;没有记录dump文件&#xff0c;或者程序启动时发生异常&#xff0c;比如常见的 应用程序无法正常启动(0xc000007b) 报错&#xff0c;都可以使用WinDbg动态调试功能来定位问题。文章最后&#xff0c;…