【全部更新完毕】2024全国大学生数据统计与分析竞赛B题思路代码文章教学数学建模-电信银行卡诈骗的数据分析

news2025/2/24 6:19:01

电信银行卡诈骗的数据分析

摘要

电信银行卡诈骗是当前社会中严重的犯罪问题,分析电信银行卡交易数据,找出高风险交易特征,建立预测模型,将有助于公安部门和金融机构更好地防范诈骗行为,保障用户的财产安全。

针对问题一,为了解电信银行卡交易数据中的诈骗情况,我们进行了详细的数据分析。首先,通过统计交易数据中发生诈骗和未发生诈骗的次数,绘制了比统计并绘制了线上和线下诈骗数量的柱状图,明确了两者的对比情况。这些分析结果不仅揭示了电信银行卡诈骗的基本例的扇形图,直观展示了诈骗的普遍程度。其次,筛选出发生诈骗的交易记录情况,还为进一步研究和制定防范措施提供了数据支持。

在问题二中,通过对电信银行卡交易数据的详细分析,我们比较了使用银行卡在设备上进行转账交易与使用银行卡pin号码进行转账交易两种情况下的诈骗率。结果显示,使用银行卡在设备上进行转账交易的诈骗率是否高于未使用情况下的诈骗率可以揭示这种交易方式的风险程度。此外,使用pin号码的情况下,若诈骗率低于未使用情况,则说明使用pin号码有助于减少被骗概率。

在问题三中,通过对电信银行卡交易数据的详细分析,我们发现“是否是线上的银行卡转账交易”和“银行卡转账交易是否发生在同一银行”与电信诈骗存在显著关联。相关性矩阵显示,这些指标与诈骗发生有较强的相关性,提示线上交易和同一银行交易在诈骗行为中具有重要影响。卡方检验结果进一步确认了这些关联,为防范电信诈骗提供了重要依据。

在问题四中,通过对电信银行卡交易数据的详细分析,我们选择了包括交易距离、金额比值、是否在同一银行、是否使用设备和pin号码进行交易、是否线上交易等特征,使用逻辑回归模型建立了电信诈骗预测模型。经过数据标准化和训练后,模型在测试集上的预测准确率较高达到96%。分析结果表明,线上交易是电信诈骗的重要影响因素。

关键词:相关性分析、电信诈骗、逻辑回归模型、卡方检验、相关性矩阵

目录

摘要

一、问题重述

1.1问题背景

1.2要解决的问题

二、问题分析

2.1任务一的分析

2.2任务二的分析

2.3任务三的分析

三、问题假设

四、模型原理

4.1ARIMA模型

4.2 xgboost模型

4.3 DBSCAN模型

4.4自行替换kmeans/简单指数平滑等的模型介绍

五、模型建立与求解

5.1问题一建模与求解

5.2问题二建模与求解

5.3问题三建模与求解

六、模型评价与推广

6.1模型的评价

6.1.1模型缺点

6.1.2模型缺点

6.2模型推广

七、参考文献

附录【自行删减】

5.1 问题一建模与求解

问题一主要包含两个任务,一是绘制“有无发生电信银行卡诈骗”比例的扇形图;二是绘制发生电信银行卡诈骗的案例中,“线上”和“线下”发生电信诈骗数量的柱状图.对于任务一,首先需要进行数据的统计分析,包含如下几个步骤:

1.读取数据:从提供的CSV文件中读取电信银行卡交易数据,包含诈骗与否的标识。

2.计算比例:通过统计每种情况(发生诈骗和未发生诈骗)的次数,计算其比例。

3.绘制图表:使用扇形图(饼图)展示比例分布,直观呈现数据集中诈骗和非诈骗交易的比例。

首先使用pandas 库读取数据文件,确保数据格式正确且无缺失值。获取到的部分数据如上所示,由于后面的问题都需要使用到该数据文件,之后内容中的读取部分不在重复说明。

根据读取到的数据,我们对Fraud 列进行 value_counts() 统计,得到发生诈骗和未发生诈骗的次数。随后进一步计算比例:通过统计的次数,计算每种情况的比例,分别表示为“未发生诈骗”和“发生诈骗”。在得到了比例之后,可以进一步绘制扇形图:使用 matplotlib 库的 pie 函数,绘制扇形图,标注每部分的百分比及标签。结果展示如下。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

本文所建立模型具有以下优点 :

1.模型的整体表现较为优秀,准确率高达96%,意味着在大多数情况下能够正确判断交易是否为诈骗。具体到类别性能,模型在非诈骗类交易的识别上表现尤为突出,精确率为0.96,召回率为0.99,F1-score为0.98,显示了模型在辨识正常交易方面的高效性和可靠性。

6.1.2模型缺点

本文所建立模型仍有以下不足:

1.需要大量的数据支持,并且对数据的质量有较高要求。噪声和数据缺失可能会影响周期的准确识别。

2.尽管诈骗类的精确率相对较高(0.89),但召回率只有0.60,导致F1-score为0.72。这表明虽然模型能够准确识别出部分诈骗交易,但还有相当比例的诈骗交易未能被检测出来,存在较多的假负类错误(实际为诈骗但预测为非诈骗)。

6.1模型推广

数据增强和特征工程:通过增加训练数据的多样性或引入更多相关特征来增强模型的学习能力和泛化能力。特别是对诈骗类交易的数据进行增强,以改善模型在该类别上的表现。

1.高级模型探索:考虑使用更复杂的机器学习算法如随机森林、梯度提升机(GBM)或深度学习模型,这些模型可能在处理复杂模式和大数据集时表现更好。

2.模型集成方法:通过集成多个模型来提高预测准确性和稳定性,尤其是在处理不平衡数据时,集成学习能有效提高少数类的识别率。

3.持续监控和模型更新:定期评估模型的表现,并根据最新的交易数据和诈骗手段更新模型,确保模型的实时性和准确性。指数平滑模型可以广泛应用于零售、制造业和供应链管理中的需求预测。它特别适合于需求数据具有明显趋势或季节性模式的场合。为了提高模型的适应性和鲁棒性,建议结合异常值检测和修正方法,并定期更新模型参数以适应需求模式的变化。

通过这些策略,不仅可以提升模型在现有数据集上的表现,还能增强其对新型诈骗手段的适应能力和响应速度,从而在实际应用中更有效地帮助银行和监管机构预防和打击电信银行卡诈骗行为。

### 2024全国大学生数据统计与分析
### https://docs.qq.com/doc/DVW5uSVBxbU5aQnla

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1801861.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Golang | Leetcode Golang题解之第131题分割回文串

题目: 题解: func partition(s string) (ans [][]string) {n : len(s)f : make([][]int8, n)for i : range f {f[i] make([]int8, n)}// 0 表示尚未搜索,1 表示是回文串,-1 表示不是回文串var isPalindrome func(i, j int) int8…

【Python】常见的第三方库及实例

各位大佬好 ,这里是阿川的博客 , 祝您变得更强 个人主页:在线OJ的阿川 大佬的支持和鼓励,将是我成长路上最大的动力 阿川水平有限,如有错误,欢迎大佬指正 库介绍 Python是通过模块来体现库&#xff0…

底板外设倒灌到处理器分析

在嵌入式系统中,底板外设通常与处理器通过各种接口(如UART、SPI、I2C、GPIO等)进行连接。这些外设可能包括传感器、执行器、存储器、通信模块等。倒灌是指当外设向处理器提供的信号电平超出了处理器能够接受的范围,导致处理器无法…

让 AI 写高考作文丨10 款大模型 “交卷”,实力水平如何?

文章部分素材来源 | CSDN(ID:CSDNnews) 前言 在科技日新月异的今天,人工智能(AI)已不再是遥不可及的未来科技,而是逐渐融入我们日常生活的实用工具。从智能语音助手到自动驾驶汽车&#xff0c…

Redis 实现持久化

Redis ⽀持 RDB ( 定期备份 ) 和 AOF ( 实时备份 ) 和 混合持久化 (结合RDB 和 AOF 的特点) 持久化机制,持久化功能有效地避免因进程退出造成数据丢失问题, 当下次重启时利⽤之前持久化的⽂件即可实现数据恢复。 RDB(Redis DataBase&#xff…

Python深度学习基于Tensorflow(16)基于Tensorflow的对话实例

文章目录 基础数据清洗数据生成词汇表定义分词器并制作数据集构建Transformer模型并训练模型推理 Tensorflow 的核心就是注意力机制,在之前详细的介绍过,具体可以看这个:Python深度学习基于Tensorflow(9)注意力机制_te…

【传知代码】Noise2Noise图像去噪(论文复现)

前言:在数字时代,图像已成为我们记录生活、传达信息、探索世界的重要媒介。然而,随着摄影技术的飞速发展,图像噪声——这一影响图像质量的顽疾,始终困扰着我们。Noise2Noise图像去噪技术为我们提供了一种全新的解决方案…

【设计模式】结构型-装饰器模式

在代码的海洋深处迷离,藏匿着一片神奇之地。那里有细腻的线条交错,是装饰器的奇妙艺术。 文章目录 一、登录的困境二、装饰器模式三、装饰器模式的核心组成部分四、运用装饰器模式五、装饰器模式的应用场景六、小结推荐阅读 一、登录的困境 假设我们有…

【经验分享】搭建跨境电商那个独立站必备的功能模块以及实现

搭建跨境电商独立站时,需要确保网站具备一系列关键的功能板块,以提供用户友好的购物体验并确保业务的顺利进行。以下是这些功能板块的详细归纳: 注册登录与身份验证: 用户注册与登录:允许用户创建账户,通过…

CST纳米光学 --- LSPR局部等离子激元共振,消光截面ECS,法诺共振

这期我们用自带的Drude散射粒子,计算消光截面。 查看模型,内核是Silica二氧化硅,正常的介质材料,半径是38纳米: 外围是Drude模型的金属材料包裹,半径48纳米,该材料的参数可由宏Materials->Cr…

洁净室气流流型分类及气流流型可视化验证

洁净室气流 流型的分类 洁净室是空气悬浮粒子浓度受控的房间,其建造和使用方式可最大限度减少房间进入的、产生的和滞留的粒子。房间内的温度、湿度、压力等其他相关参数均按要求受控(ISO14644-6)。 #深度好文计划# 一.洁净室的四大技术要素…

招募来袭 | 与热爱技术的谷歌开发者一起创造精彩

写在前面 技术的进步在不断推动着世界发展。从 Android、Flutter 等产品的稳步更新迭代,到秉承着负责任的态度对 AI 进行探索,我们通过每一次的技术跃进,帮助大家打开新的视野,激发更多的灵感,将我们的工具和平台打造成…

线控转向 0 -- 线控转向介绍和专栏规划

一、线控转向介绍 高阶自动驾驶核心部件:英创汇智线控转向解决方案 _北京英创汇智科技有限公司 (trinova-tech.com) 线控转向的系统组成详细介绍大家可以看上面这个链接;我这里也只从里面截取一些图片,简单说明。 1、结构组成 线控转向分为…

【前端基础】CSS介绍|CSS选择器|常用CSS

目录 一、CSS介绍 1.1 什么是CSS 1.2 基本语法规范 1.3 引⼊⽅式 1.4 规范 💡二、CSS选择器 1. 标签选择器 2. class选择器 3. id选择器 4. 复合选择器 5. 通配符选择器 三、常用CSS 3.1 color 3.2 font-size 3.3 border 3.4 width/height 3.5 padd…

C51单片机 串口打印printf重定向

uart.c文件 #include "uart.h"void UartInit(void) //4800bps11.0592MHz {PCON | 0x80; //使能波特率倍速位SMODSCON 0x50; //8位数据,可变波特率。使能接收TMOD & 0x0F; //清除定时器1模式位TMOD | 0x20; //设定定时器1为8位自动重装方式TL1 0xF4; //设…

BUG解决: Zotero 文献GBT7714无法正常调用

1. 下载csl文件 网上有推荐直接下载现成版本的,比如参考资料【1】的蓝奏云文件,但是还是无法实现功能(空文档中可以用了)。 2. Github版本 也有说网盘版本和那个 Juris-M 的 CSL bug 太多的。 总结 后面发现,只需…

【生产排查】解决 Kettle 没有运行日志的问题

文章目录 背景排查解决第 1 步:修改 kettle-service.conf,添加日志配置第 2 步:使用最新配置文件重启 kettle第 3 步:验证日志配置是否生效背景 🚀 项目使用 Kettle 作为 ETL 工具,从外部系统中抽取数据、转换数据、并最终加载到本项目的数据库中。 😂 存在的问题:据…

JVM学习-详解类加载器(二)

双亲委派机制 双亲委派优势 避免类的重复加载,确保一个类的全局唯一性 Java类随着它的类加载器一起具备了一种带有优先级的层次关系,通过这种层次关系可以避免类的重复加载,当父类已经加载了该类,就没有必要子ClassLoader再加载…

ai辅助教育孩子

孩子经常躺在床上看手机是一个需要关注的问题,因为这不仅可能影响他们的视力健康,还可能影响睡眠质量和身体健康。以下是一些建议,帮助应对这一问题: 设定明确的规定: 与孩子一起制定使用手机的规则,如每天…