kaggle经典赛 | IEEE欺诈检测竞赛金牌方案分享

news2024/11/19 16:35:42

https://www.kaggle.com/competitions/ieee-fraud-detection

赛题背景

想象一下,站在杂货店的收银台,身后排着长队,收银员不那么安静地宣布你的卡被拒绝了。在这一刻,你可能没有考虑决定你命运的数据科学。

尴尬,并且确定您有足够的资金来支付 50 个最亲密朋友的史诗般的玉米片派对所需的一切,您再次尝试您的卡。相同的结果。当您退到一边并让收银员照顾下一个客户时,您会收到来自银行的短信。“如果你真的想花500美元买切达奶酪,请按1。

虽然目前可能很麻烦(而且经常令人尴尬),但这种欺诈预防系统实际上每年为消费者节省数百万美元。IEEE计算智能学会(IEEE-CIS)的研究人员希望改善这一数字,同时改善客户体验。通过更准确的欺诈检测,您可以轻松使用筹码。

IEEE-CIS适用于各种人工智能和机器学习领域,包括深度神经网络、模糊系统、进化计算和群体智能。今天,他们正在与世界领先的支付服务公司Vesta公司合作,为欺诈预防行业寻求最佳解决方案,现在邀请您加入挑战赛。

赛题任务

在本次竞赛中,参赛者将在一个具有挑战性的大规模数据集上对机器学习模型进行基准测试。这些数据来自Vesta的真实电子商务交易,包含从设备类型到产品功能的广泛功能。参赛者还有机会创建新功能来改善结果。

数据描述

在本次竞赛中,参赛者预测的是在线交易欺诈的可能性,如二进制目标所示。

数据分为两个文件identitytransaction,由TransactionID连接。并非所有交易都有相应的身份信息。

  • Categorical Features - Transaction
    • ProductCD

    • card1 - card6

    • addr1, addr2

    • P_emaildomain

    • R_emaildomain

    • M1 - M9

  • Categorical Features - Identity
    • DeviceType

    • DeviceInfo

    • id_12 - id_38

  • Files
    • train_{transaction, identity}.csv

    • test_{transaction, identity}.csv

    • sample_submission.csv

评估标准

该竞赛的评估指标是ROCAUC (Area Under the ReceiverOperating Characteristic Curve) ,参赛者需要尽可能地提高自己模型的ROCAUC得分。竞赛的排名是根据提交的测试集预测结果的ROCAUC得分来确定的,得分越高排名越靠前。

优胜方案

第一名

https://www.kaggle.com/c/ieee-fraud-detection/discussion/111284

对抗性验证具有AUC=1的原因不是因为欺诈的性质随着时间的推移而发生根本性的变化,而是因为数据集中的客户端随着时间的推移而发生根本性的变化。

一旦你意识到这一点,你就会知道这场竞赛的挑战是建立一个可以预测看不见的客户(不是看不见的时间)的模型。下图显示了私有数据集(有 400,000 行)中的数据。68.2% 的数据是我们在训练数据集中看不到的客户端。16.4% 的数据同时位于训练数据集和测试数据集中。15.4%我们不确定。下面的每条蓝线都是一个客户端。每个客户进行许多交易,蓝线的左端是他们时间的第一笔交易,右端是最后一笔交易。

我们标签的逻辑是将卡上报告的拒付定义为欺诈交易 (isFraud=1),并将用户帐户、电子邮件地址或账单地址直接链接到这些属性的交易定义为欺诈。如果上述情况均未报告且发现超过 120 天,则我们定义为合法交易 (isFraud=0)。

第二名:https://www.kaggle.com/competitions/ieee-fraud-detection/discussion/111321

第五名:https://www.kaggle.com/competitions/ieee-fraud-detection/discussion/111735

第六名:https://www.kaggle.com/competitions/ieee-fraud-detection/discussion/111247

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”领取190+场比赛top方案合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/541439.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一文搞定验证码(上部分)

1.背景 目前收到反馈,存在一类用户,在利用会员权益大量进行二次销售;而且还是自动进行操作的. 那么意味着他们有一个自动平台在对我们的商品进行二次销售. 这是就该我们的主角登场了. 验证码模块可以有效防止机器人刷接口 2.开源验证码框架 通过在网上查找资料, 发现了几个验…

C++:采用哈希表封装unordered_map和unordered_set

目录 一. 如何使用一张哈希表封装unordered_map和unordered_set 二. 哈希表迭代器的实现 2.1 迭代器成员变量及应当实现的功能 2.2 operator函数 2.3 operator*和operator->函数 2.4 operator!和operator函数 2.5 begin()和end() 2.6哈希表迭代器实现代码 三. unord…

渗透测试--6.2.mdk3攻击wifi

前言 本次依然使用Kali虚拟机系统,win11主机,网卡Ralink 802.11 配合mdk3进行wifi伪造、连接设备查看、解除认证攻击。本次实验只用于学习交流,攻击目标为自家的手机热点,请勿违法使用! 目录 前言 1.Deauth攻击原…

Electron简介、安装、实践

本文中的所有代码均存放在https://github.com/MADMAX110/my-electron-app Electron是什么? Electron是一个开源的框架,可以使用JavaScript, HTML和CSS来构建跨平台的桌面应用程序。Electron的核心是由Chromium和Node.js组成,它们分别提供了渲…

【springboot 开发工具】接口文档我正在使用它生成,舒坦

前言 先来描述下背景:由于新公司业务属于自研产品开发,但是发现各产品业务线对于接口文档暂时还是通过集成Swagger来维护,准确来说是knife4j(Swagger的增强解决方案)。但是对于5年的后端开发老说,早就厌倦…

Java-线程安全的四个经典案例和线程池

单例模式 有些对象,在一个程序中应该只有唯一 一个实例(光靠人保证不靠谱 借助语法来保证) 就可以使用单例模式 在单例模式下 对象的实例化被限制了 只能创建一个 多了的也创建不了 单例模式分为两种:饿汉模式和懒汉模式 饿汉模式…

[Java基础]—SpringBoot

Springboot入门 Helloworld 依赖 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.3.4.RELEASE</version> </parent><dependencies><depend…

软件测试基础知识整理(四)- 软件开发模型、测试过程模型

目录 一、软件开发模型 1.1 瀑布模型 1.1.1 特点 1.1.2 优缺点 1.2 快速原型模型&#xff08;了解&#xff09; 1.2.1 特点 1.2.2 优缺点 1.3 螺旋模型&#xff08;了解&#xff09; 1.3.1 特点 1.3.2 优缺点 二、测试过程模型 2.1 V模型&#xff08;重点&#xff…

LeetCode_29. 两数相除

目录 题目描述 思路分析 我的题解 题目描述 给你两个整数&#xff0c;被除数 dividend 和除数 divisor。将两数相除&#xff0c;要求 不使用 乘法、除法和取余运算。 整数除法应该向零截断&#xff0c;也就是截去&#xff08;truncate&#xff09;其小数部分。例如&#xff…

8个免费的高质量UI图标大全网站

UI图标素材是设计师必不可少的设计元素。 高质量的UI图标会让设计师的设计效率事半功倍。 本文分享8个免费的高质量UI图标大全网站。 即时设计资源社区 即时设计资源广场中精选了多款专业免费的UI图标设计资源&#xff0c;无需下载即可一键保存源文件&#xff0c;同时还提供…

深入浅析Linux Perf 性能分析工具及火焰图

Perf Event 子系统 Perf 是内置于 Linux 内核源码树中的性能剖析&#xff08;profiling&#xff09;工具。它基于事件采样的原理&#xff0c;以性能事件为基础&#xff0c;支持针对处理器相关性能指标与操作系统相关性能指标的性能剖析。可用于性能瓶颈的查找与热点代码的定位…

Maven PKIX path building failed 错误提示

最近公司的项目突然出现了下面的提示。 PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target -> [Help 2]问题和解决 出现上面的提示的问题是因为 SSL 签名的问题。 …

经典面试题:理解Cookie和Session之间的区别

文章目录 一、Cookie概念先知1、Cookie是什么&#xff1f;2、Cookie从哪里来&#xff1f;3、Cookie要存到哪里去&#xff1f;4、Cookie是存在哪里的&#xff1f;5、浏览器是如何通过Cookie来记录的&#xff1f;6、Cookie的过期时间有什么用&#xff1f; 二、见见Cookie三、会话…

软件设计师考试笔记,已通过

目录 系统可靠度 外部实体 内聚类型 编译过程 逆波兰式 前驱图 scrum框架模型 编译和解释 有限自动机 聚簇索引和非聚簇索引 二叉树的前序,中序,后序遍历 动态规划贪心算法 算法 01背包问题 系统可靠度 1. 串联部件可靠度 串联部件想要这条路走通&#xff0c;只有…

软件测试行业7年了,薪资从10k到了22k,感觉到头了?

蜕变之前 明天的希望&#xff0c;让我们忘了今天的痛苦。 怎样区别一个废柴和一个精英&#xff1f;看外貌&#xff0c;看气质&#xff0c;看谈吐&#xff0c;看消费… 有人忙着把人和人进行分类&#xff0c;有人忙着怎么从这一阶层过渡到上一阶层。当你很累的时候&#xff0c…

引入外部文件实现步骤

1.引入数据库相关依赖 2.创建外部属性文件&#xff0c;properties格式&#xff0c;定义数据信息&#xff1a;用户名 密码 地址等 3.创建spring配置文件&#xff0c;引入context命名空间&#xff0c;引入属性文件&#xff0c;使用表达式完成注入 <beans xmlns"http://w…

交友项目【集成环信Api】

目录 1&#xff1a;自动装配 2&#xff1a;查询用户环信账户 3&#xff1a;环信ID查询用户信息 1&#xff1a;自动装配 在项目中集成环信API&#xff0c;完成即时通信等 环信官方文档地址&#xff1a;Java Server SDK [IM 开发文档] 自动装配模块&#xff1a; pom文件相关…

2.数据结构期末复习之顺序表和链表

1.表是可以是线性结构 学号姓名19(数据项)jams(数据项)20(数据项)ming(数据项) 19 jams或 20 ming是数据元表单个的是数据项‘’线性结构可以表示为 19 jams->20 ming2.什么是逻辑结构?:具有相同类型的有限序列(元素排序的位置,排兵布阵操作的方法) a1 a2 a3 .... an (空…

jenkins流水线使用入门示例

之前采用Jenkins的自由风格构建的项目&#xff0c;每个步骤流程都要通过不同的方式设置&#xff0c;并且构建过程中整体流程是不可见的&#xff0c;无法确认每个流程花费的时间&#xff0c;并且问题不方便定位问题。 Jenkins的Pipeline可以让项目的发布整体流程可视化&#xf…

低代码开发大势所趋,这款无代码开发平台你值得拥有

文章目录 什么是低代码iVX和其它低代码的平台的区别没有创新的“拼凑”&#xff0c;没有好东西iVX在线编辑器体验 什么是低代码 低代码&#xff08;Low Code&#xff09;是一种可视化的应用开发方法&#xff0c;用较少的代码、以较快的速度来交付应用程序&#xff0c;将程序员…