2023招商Fintech数据赛道rank33 赛后分享

news2024/11/16 5:28:10

赛题需求:
本次比赛为参赛选手提供了两个数据集,即训练数据集(train)和测试数据集(test_A榜/test_B榜)。参赛选手需要基于训练数据集,通过有效的特征提取,构建客户进取类产品配置发生时点预测模型,并将模型应用于测试数据集上,输出测试集客户的资配行为预测:任务1:哪些客户会在任务1:来14天内发生进取类产品配置;(二分类,评价指标F2)
任务2:在任务1的基础上,进一步预测配置行为发生在未来的哪一天。(回归)
难点: 训练标签和测试标签样本不平衡
在这里插入图片描述

  1. 数据处理:
    删除特征分布较大的特征;缺失值的样本较少(通过数据分析发现,信息缺失严重的用户未来购买理财产品比列很小);
  2. 特征构造
    客户历史购买数据表:
    • 按照购买金额的正负分别构造特征:
      • 金额为负时:mean、min、max、sum、count、nunique。
      • 金额为正时:mean、min、max、sum、count、nunique。
      • 不分正负时:mean、sum、count、nunique。
      • 客户最近购买时间、客户平均购买隔时长、客户购买最大间隔、客户购买最短间隔、客户
        客户历史浏览数据表:
    • 将日期分成时间段(所有浏览记录时是8.1-8.31号的,将其分成四段进行构造特征):
      • 1-8日统计page_id(网页id):count、nunique
      • 9-16日统计page_id(网页id):count、nunique
      • 17-24日统计page_id(网页id):count、nunique
      • 25-31日统计page_id(网页id):count、nunique
    • 客户点击序网页列特征:利用word2vec进行训练得到特征向量 (强特
    • 客户最近点击时间、客户平均点击间隔时长、客户点击最大间隔、客户点击最短间隔
  3. 模型和优化
    • 模型:lightgbm、xgboost(最好)、catboost、三者平均
    • 优化:利用对抗验证选择与测试集分布差不多的验证集、搜索最佳F2阈值

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/498121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣sql中等篇练习(十六)

力扣sql中等篇练习(十六) 1 不同性别每日分数统计 1.1 题目内容 1.1.1 基本题目信息 1.1.2 示例输入输出 a 示例输入 b 示例输出 1.2 示例sql语句 # 分数是往后累加的 SELECT s2.gender,s2.day,sum(s1.score_points) total FROM Scores s1 CROSS JOIN Scores s2 ON s2.gen…

java创建多线程的方法

Java中是可以创建多个线程的,每个线程都有自己的名字和时间戳。下面我们来看看创建多个线程的方法。 创建多个线程,需要使用到 Thread类中的 create方法。需要注意的是,不是所有的线程都可以使用 create方法来创建,只有当这些线程…

目前可用的ChatGPT网站

本文意在整理可用gpt-3.5、gpt-4.0等网站。 本文主要是方便自己翻阅,如对您也有所帮助,不胜荣幸~ 文章目录 chatgpt.qdymys.cngpttalkchatgpt-cn.cobing.com总结 chatgpt.qdymys.cn 网址:https://chatgpt.qdymys.cn/限制:三小时只…

【新星计划-2023】TCP/IP协议讲解

相信大家在学习的过程中一定听到过TCP/IP这个协议,那么,TCP/IP协议是什么?为什么会有TCP/IP协议? 一、TCP/IP是什么? TCP/IP是用于计算机通信的一组协议,我们通常称它为TCP/IP协议族。它是70年代中期美国…

Spring Boot项目瘦身

目录 1,什么是瘦身?2,为什么要瘦身?3,如何瘦身?3.1,瘦身思路:3.2,瘦身方法 4,瘦身后运行 1,什么是瘦身? 瘦身:thinBody&a…

CSS进阶

01-复合选择器 定义:由两个或多个基础选择器,通过不同的方式组合而成。 作用:更准确、更高效的选择目标元素(标签)。 后代选择器 后代选择器:选中某元素的后代元素。 选择器写法:父选择器 …

Spring AOP续--织入

上篇讲到SpringAOP的一些用法以及概念,这里我们单独讲一下AOP中的“织入”。 我们知道,SpringAOP是基于动态代理实现的技术,而织入则是一个生成动态代理对象并且将切面和目标对象方法编织成为约定流程的过程。 对于通知,上篇文章…

数字化转型导师坚鹏:如何制定与实施企业数字化转型年度培训规划

如何制定与实施企业数字化转型年度培训规划 ——以推动企业数字化转型战略落地为核心,实现知行果合一 课程背景: 很多企业都在开展企业数字化转型培训工作,目前存在以下问题急需解决: 缺少针对性的企业数字化转型年度培训规划…

Python每日一练(20230507) 丑数I\II\III、超级丑数

目录 1. 丑数 Ugly Number I 2. 丑数 Ugly Number II 3. 丑数 Ugly Number III 4. 超级丑数 Super Ugly Number 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日一练 专栏 1. 丑数 Ugly Number I …

JavaWeb——1.JavaWeb概述

这是我们javaweb的第一篇文章,首先我们来介绍一下什么是Javaweb JavaWeb:使用java语言完成服务器端程序开发 如下面这张图所示: 可能不太好理解,那么就用通俗的语言来解释一下。 任何的一个应用程序,首先它会有页面…

在 Python 中将秒转换为小时、分钟和秒

文章目录 在 Python 中使用数学计算将秒转换为小时、分钟和秒的自定义函数在 Python 中使用 divmod() 函数将秒转换为小时、分钟和秒在 Python 中使用 DateTime 模块将秒转换为小时、分钟和秒在 Python 中使用时间模块将秒转换为小时、分钟和秒 本篇文章将讨论使用 Python 中的…

Golang每日一练(leetDay0058) 比较版本号、分数转小数

目录 165. 比较版本号 Compare Version Numbers 🌟🌟 166. 分数到小数 Fraction To Recurring Decimal 🌟🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 …

Python动态绘图详解

文章目录 示例FuncAnimation三维情况 示例 matplotlib中的animation提供了动态绘图功能,下面列举一个最简单的动态绘制三角函数的例子,来初步演示一下。 import numpy as np import matplotlib.pyplot as plt import matplotlib.animation as animatio…

深入理解Java虚拟机——垃圾收集器

1.前言 在前面我们已经说过了垃圾收集算法,那么现在我们要讲的垃圾收集器,实际上就是对垃圾收集算法的实践。 首先我们先看一张图,这张图可以帮助我们了解各款经典垃圾收集器之间的关系: 图中的垃圾收集器所在的区域代表了它是属…

学系统集成项目管理工程师(中项)系列18b_进度管理(下)

1. 制定进度计划 1.1. 分析活动顺序、持续时间、资源需求和进度制约因素,创建项目进度模型的过程 1.2. 输入 1.2.1. 进度管理计划 1.2.2. 活动清单 1.2.3. 活动属性 1.2.4. 项目进度网络图 1.2.5. 活动资源需求 1.2.6. 资源日历 1.2.7. 活动持续时间估算 …

Linux网络编程——套接字网络编程预备知识

0.关注博主有更多知识 操作系统入门知识合集 目录 1.理解IP地址和MAC地址 2.认识端口号 3.感性认识TCP协议和UDP协议 4.网络字节序 5.socket编程接口 1.理解IP地址和MAC地址 事实上在上一篇博客当中粗浅了介绍一个IP地址MAC地址,其中我们知道IP地址提供方向…

坐标系变换推导(欧拉角、方向余弦矩阵、四元数)+代码解析

一、为什么选择四元数 描述两个坐标系之间的变换关系主要有几个方法 1、欧拉角法(存在奇异性和万向锁而且三个轴旋转的顺序不好定) 2、方向余弦矩阵法(翻译为Directional cosine matrix,简称DCM,也称为旋转矩阵,看了很多博客写的是C11-C33的那…

【Python实操】如何快速写一个乒乓球游戏?

文章目录 前言一、 导入 turtle 和 Screen二、创建一个球3.创建一个 AI 挡板4.创建自己的挡板5.创建移动AI挡板的函数6.创建一个函数以移动你的挡板并用键盘控制它7.全部代码总结 前言 本文提供了一个 Python 实现的乒乓球游戏代码,你只需要将代码复制并粘贴到编辑…

如何防御流量攻击

随着互联网的发展,网络安全问题也日益突出。其中,流量攻击成为网络攻击的一种常见手段。那么流量攻击属于什么攻击,服务器防御流量攻击的方法有哪些呢?本文小编将为您一一解答。 一、流量攻击是什么? 流量攻击即DDoS攻击,全称为…

如何进行DNS优化

在互联网时代,网站的访问速度直接影响着用户体验和转化率。而DNS(Domain Name System)作为域名解析系统,负责将域名转换为IP地址,是网站访问速度的重要因素之一。因此,DNS优化成为了提升网站速度的重要手段之一。 DNS优化到底是什…