【DS Solutions】一个反欺诈产品的进化,Stripe Radar

news2024/11/17 11:28:37

b705bab883f84c0eb93abaaa4c8e457d.png

Stripe Radar 是 Stripe 提供的一项防欺诈服务,它利用机器学习技术来帮助商家检测和阻止信用卡欺诈行为。这篇文章是Stripe公司关于其反欺诈解决方案Stripe Radar的构建过程的介绍。文章从Stripe的防欺诈团队工程师的角度出发,详细讲述了Stripe Radar的工作原理、技术架构的演进、机器学习(ML)特征的重要性,以及如何提供交易欺诈决策的解释。

原文链接:https://stripe.com/blog/how-we-built-it-stripe-radar

文章开篇描述了Stripe Radar在用户点击“购买”到交易确认之间的极短时间内的工作流程。Stripe Radar通过评估超过1000个潜在交易特征来确定其欺诈可能性,准确率极高,错误阻止的合法交易仅占0.1%。

In that brief interval, Stripe Radar goes to work. Radar is Stripe’s fraud prevention solution. It assesses more than 1,000 characteristics of a potential transaction in order to determine the likelihood that it’s fraudulent, letting good transactions through and either blocking risky transactions or diverting them to additional security checks. It makes this decision, accurately, in less than 100 milliseconds. Out of the billions of legitimate payments made on Stripe, Radar incorrectly blocks just 0.1%.

Lesson 1: 不要对机器学习架构过于自满

Stripe Radar的构建始于相对简单的机器学习模型,随着Stripe网络的扩展和机器学习技术的进步,逐渐发展到更复杂的深度神经网络模型。2022年中期,Stripe从“Wide & Deep”模型迁移到了纯DNN模型,这一转变显著提升了模型的训练速度和扩展性。

deaf334bdd18f26c12d6b807439ec57e.png

Stripe Radar原先的架构结合了XGBoost的记忆能力和深度神经网络(DNN)的泛化能力,虽然有效,但在扩展性上存在局限。XGBoost在大规模应用中与Stripe希望采用的更先进的机器学习技术(如迁移学习、嵌入和长时间训练)不兼容,并且由于其并行化程度不高,限制了模型的再训练速度和工程师们的实验速度。

尽管移除XGBoost组件可以简化架构,但这将导致召回率下降1.5%,这是不可接受的性能退步。为了在不牺牲DNN泛化能力的同时增加其记忆能力,Stripe探索了增加DNN的大小——深度和宽度,但同时也要避免过拟合的风险。

Stripe通过研究DNN架构的流行出版物,最终采用了受ResNeXt启发的多分支DNN架构。这种架构采用“Network-in-Neuron”策略,将计算分割成不同的线程或分支,每个分支可以视为一个小网络,最终将分支的输出汇总以产生最终输出,从而在不单纯增加深度或宽度的情况下提高准确性。

通过去除XGBoost组件,Stripe将模型的训练时间减少了85%以上,使得原本需要通宵运行的实验现在在一天之内可以多次完成,极大地提高了原型设计的能力。

Lesson 2: 永远不要停止寻找新的机器学习特征

Stripe Radar通过不断寻找和实现新的机器学习特征来提高模型性能。Stripe团队通过详细分析欺诈行为,识别出可能对模型性能有重大影响的特征,并快速实施和测试这些特征。

Stripe Radar通过细致分析欺诈尝试的共同行为,积累了对欺诈活动和趋势的深入理解。这种理解为Radar提供了一个重要优势:训练数据集规模的每次增加都能显著提高模型质量,这在XGBoost情况下并不明显。

Each increase in the size of Radar’s training data set creates outsized improvements in model quality, which wasn’t the case with XGBoost.

特征工程作为提升模型的关键,Stripe通过创建多个流程来赋能机器学习工程师,以识别和实施可能对模型性能产生重大影响的特征。通过详细回顾过去的欺诈攻击,构建调查报告,寻找支付中的信号,比如欺诈者可能用于快速设置多个账户的一次性电子邮件模式。

Stripe探索了通过增加训练数据量来提升模型性能的方法。尽管训练时间随训练数据量线性增加,但由于切换到DNN架构后训练速度的提升,这不再是问题。实验结果显示,即使训练数据量增加了10倍,模型性能仍有显著提升,Stripe正在探索100倍的数据量扩展。c73a7c9242185c06ac6d68843810c383.png

Lesson 3: 解释的重要性不亚于检测

除了检测欺诈,Stripe Radar还重视向用户解释欺诈决策的原因。尽管机器学习模型通常难以解释,Stripe的工程师们已经开发了多种方法来提高透明度。这是一个挑战。所有的机器学习模型在某种程度上都是黑箱,深度神经网络比其他类型的模型更是如此。向用户解释为什么Radar会以这种方式对交易进行评分是困难的。这是我们在决定使用DNN而不是更简单、更传统的机器学习技术时不得不接受的另一个权衡。但我们的工程师对系统非常了解,并已经开发了一系列方法来帮助用户理解发生了什么。

2020年推出的风险洞察功能允许用户了解哪些交易特征导致了交易被拒绝,并通过地图和Elasticsearch等工具提供更多上下文信息,帮助用户更好地理解交易评分背后的逻辑。这些改进展示了Stripe在提高模型可解释性方面的持续努力和投资。

10d57f011e33fadfc729ade718e23785.png

比如,可能包括持卡人姓名是否与提供的电子邮件匹配,以及之前与IP地址关联的卡的数量。卡片数量多可能表明可疑行为,例如一个不良行为者尝试使用多个被盗信用卡。然而,这也可能存在合理的理由,我们的模型会在所有信号的背景下评估这个特征,理解它们之间可能存在的相关性,以准确区分欺诈和正当支付。

Summary

Radar与我们最初开始时的产品已经大不相同。我们已经彻底改革了我们使用的模型,我们利用Stripe网络中的交易数据的方式,以及我们与用户的互动方式。在同一时期,欺诈模式也发生了显著变化,从主要是盗用信用卡欺诈到今天传统银行卡欺诈和高速卡片测试攻击的日益混合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1857409.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

精益管理咨询公司在与企业沟通时,应该如何展示自己的专业性?

在竞争激烈的商业环境中,精益管理咨询公司扮演着至关重要的角色。它们不仅为企业提供策略性的指导,还帮助企业实现资源的优化配置,从而达到提高效率、降低成本的目的。那么,精益管理咨询公司在与企业沟通时,应该如何展…

西部证券:1+1>2?

又一起券商收购拉开帷幕,证券业并购浪潮呼之欲出。 这次是——西部证券。 最近,西部证券公告称,因自身发展需要正在筹划收购国融证券控股权事项, 这是继“浙商国都”、“国联民生”、“华创太平洋”之后,今年券商并购…

抓包工具whistle的安装和使用

whistle基于Node实现的跨平台web调试代理工具,类似的工具有Windows平台上的Fiddler,主要用于查看、修改HTTP、HTTPS、Websocket的请求、响应,也可以作为HTTP代理服务器使用。 一、安装 whistle,没有cnpm的可以先安装下或者直接使…

测评四款AI视频热门神器,没想到最好用的竟然是它!

在这个科技飞速发展的时代,AI视频工具已经成为我们创意与想象的最佳拍档。今天,就让我们一起走进2024年最热门的四款AI视频工具,看看它们如何为我们的创作插上翅膀!今天,就让我们一起走进2024年最热门的四款AI视频工具…

使用 HTML5 新标签 details 制作 Accordion 组件(赠送3个相关案例源码)

今天&#xff0c;我要和大家分享一个使用 HTML5 新标签 <details> 制作 Accordion&#xff08;手风琴&#xff09;组件的源码。通过这个源码&#xff0c;你可以快速掌握如何在网页中实现可折叠的问答列表功能&#xff0c;非常适合用于 FAQ 页面。 案例展示 案例效果&…

基于豆瓣电影TOP250的可视化设计

本文要完成的目的&#xff0c;实现豆瓣电影TOP250的可视化 思路 讲解思路&#xff0c;采用倒推的方式&#xff0c; 首先确定可视化图表&#xff0c;也就是最终的效果。这样就能确定需要那些基础数据根据需要的数据进行按需爬取存储。 本篇文章完成前两步。可视化图表设计 和 …

yolov7报错:报错 For debugging consider passing CUDA_LAUNCH_BLOCKING=1

报错信息 RuntimeError: CUDA error: invalid device ordinal CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING1.解决方法&#xff1a; 原因…

[图解]建模相关的基础知识-17

1 00:00:00,190 --> 00:00:09,650 那么1、2、5这个地方&#xff0c;这几个它都需要修改 2 00:00:09,660 --> 00:00:11,410 都要改成资金管理部 3 00:00:13,340 --> 00:00:15,020 那么违反第三范式 4 00:00:15,030 --> 00:00:19,650 是一个比较严重的问题 5 00:…

SVN学习(005 subversive操作分支)

尚硅谷SVN高级教程(svn操作详解) 总时长 4:53:00 共72P 此文章包含第43p-第p53的内容 介绍 创建相关目录 创建一个工程 分享到服务器端 将工程放到trunk文件夹下 在svn服务器上的位置 在branches下添加文件夹&#xff08;用于作为分支&#xff09; 创建代码分支 切换分支…

2024年6月23日

1.PPT学习赋能 调整到1907 2.动漫协会 完成 3.数据库 完成 4.慕课 完成 5.学习强国 刷满 虚伪的设计也应该提上日程了 Neo4j是一款高性能的图数据库&#xff0c;专门用于存储和处理图形数据。它采用节点、关系和属性的图形结构&#xff0c;非常适用于表示和查询复杂的实体…

ONLYOFFICE 8.1版本桌面编辑器测评

在现代办公环境中&#xff0c;选择一款功能强大且高效的办公套件至关重要。随着技术的不断进步&#xff0c;ONLYOFFICE 8.1 版本桌面编辑器以其丰富的功能和用户友好的界面成为了众多用户的首选。本文将对ONLYOFFICE 8.1版本进行详细测评&#xff0c;帮助读者了解其最新特性和优…

MUR4060PT-ASEMI逆变焊机MUR4060PT

编辑&#xff1a;ll MUR4060PT-ASEMI逆变焊机MUR4060PT 型号&#xff1a;MUR4060PT 品牌&#xff1a;ASEMI 封装&#xff1a;TO-247 恢复时间&#xff1a;35ns 最大平均正向电流&#xff08;IF&#xff09;&#xff1a;40A 最大循环峰值反向电压&#xff08;VRRM&#x…

Web渗透:文件上传漏洞

文件上传漏洞&#xff08;File Upload Vulnerability&#xff09;是网络安全中的一种常见漏洞&#xff0c;攻击者可以通过此漏洞将恶意文件上传到服务器&#xff0c;从而执行任意代码、覆盖重要文件、或进行其他恶意操作。这种漏洞可能带来严重的安全风险&#xff0c;包括数据泄…

leetcode每日一题第117天

class Solution { public:int kthToLast(ListNode* head, int k) {ListNode* slow head;ListNode* fast head;for(int i 0;i<k;i){fast fast->next;}while(fast){slow slow->next;fast fast->next;}return slow->val;} };

bable 【实用教程】

简介 bable 用于将 ES6 的语法编译为 ES5 只关心语法&#xff0c;不关心 API 是否正确。不处理模块化&#xff08;webpack 会处理&#xff09; 搭建开发环境 安装相关的包 npm i babel/cli babel/core babel/preset-env新建文件 .babelrc&#xff0c;内容为 { "presets…

探秘分布式一致性(共识)算法 :Raft

1.前言 Raft 算法是 Multi-Paxos 算法的一种&#xff0c;是一种强一致性算法。核心就是通过日志复制的方式达到整个集群的副本一致。 Raft 算法的三个核心概念就是 Leader 的选举、日志复制、节点变更。本文也将从这三个方面进行探讨。之后再聊聊 Raft 算法的几个应用场景。 2.…

Docker(七)-Docker容器数据卷

1.容器数据卷是什么 卷就是目录或者文件&#xff0c;存在于一个或者多个容器中&#xff0c;由docker挂载到容器&#xff0c;不属于容器内(类似于笔记本电脑外的一个移动硬盘)。 卷的设计目的就是数据持久化&#xff0c;完全独立于容器的生存周期&#xff0c;因此Docker不会在容…

java基于ssm+jsp 师生交流平台

1 管理员登录 管理员输入个人的账号、密码登录系统&#xff0c;这时候系统的数据库就会在进行查找相关的信息&#xff0c;如果我们输入的账号、密码不正确&#xff0c;数据库就会提示出错误的信息提示&#xff0c;同时会提示管理员重新输入自己的账号、密码&#xff0c;直到账…

css3新增了选择器,还有人不知道吗?

伪元素选择器 示例 结语 前言 CSS3给我们新增了选择器&#xff0c;可以更加便捷&#xff0c;更加自由的选择目标元素&#xff0c;你还不知道吗&#xff1f; 属性选择器 属性选择器可以根据元素特定属性的来选择元素。这样就可以不用借助于类或者 id 选择器。 | 选择符 | …

.tar格式软核文件如何在Xplorer的安装

.tar格式软核文件如何在Xplorer的安装 一&#xff0c;简介二&#xff0c;官方软核安装指导三&#xff0c;.tar和.tgz格式文件转换四&#xff0c;总结 一&#xff0c;简介 本文主要介绍.tar格式的软核文件如何在Xplorer中进行安装&#xff0c;供参考。 二&#xff0c;官方软核…