使用 MongoDB Vector Search 和 OpenAI 进行反洗钱和预防欺诈
欺诈和反洗钱 (AML) 是企业和消费者的主要担忧,影响金融服务和电子商务等行业。解决这些问题的传统方法包括静态、基于规则的系统和预测人工智能 (AI) 方法,这些方法虽然有效,但也有局限性,例如缺乏背景信息和特征工程开销以保持模型的相关性,这可能会耗费大量时间和成本。
通过解决这些限制,向量搜索可以显著改善 欺诈检测 和反洗钱工作,代表机器学习在打击欺诈方面的下一步发展。任何已经从实时分析中受益的组织都会发现,这一异常检测突破将欺诈和反洗钱检测准确性提升到了一个新的水平。
在这篇文章中,我们将研究Mongo Atlas Vector Search 支持的实时分析如何 帮助组织在欺诈发生之前发现深层隐藏的见解。
欺诈和风险技术的演变
在过去的几十年中,欺诈和风险技术分阶段发展,每个阶段都建立在以前方法的优势之上,同时也解决了它们的弱点:
风险 1.0: 在早期阶段(20 世纪 90 年代末至 2010 年),风险管理严重依赖人工流程和人为判断,决策基于直觉、过往经验和有限的数据分析。此时出现了基于规则的系统,使用预定义规则来标记可疑活动。这些规则通常是静态的, 缺乏对不断变化的欺诈模式的适应性 。
风险 2.0: 随着机器学习和高级分析的发展(从 2010 年开始),风险管理进入了 2.0 的新时代。预测建模技术被用于预测未来风险和检测欺诈行为。系统根据历史数据进行训练,变得更加集成,从而实现实时数据处理和决策过程的自动化。然而,这些系统面临着一些限制,例如:
特征工程开销: Risk 2.0 系统通常需要手动特征工程。
缺乏背景: 风险 1.0 和风险 2.0 可能没有包含广泛的变量和背景信息。
Risk 2.0 解决方案通常与基于规则的方法结合使用,因为规则是不可避免的。公司有其业务和领域特定的启发式方法以及其他必须应用的规则。
风险 3.0: 欺诈和风险技术发展的最新阶段(2023 年及以后)由矢量搜索驱动。这一进步利用实时数据馈送和持续监控来检测新出现的威胁并适应不断变化的风险形势,解决数据不平衡、手动特征工程和大量人工监督需求的局限性,同时纳入更广泛的变量和上下文信息。
根据具体的用例,组织可以组合或使用这些解决方案来有效地管理和降低与欺诈和反洗钱相关的风险。
现在,让我们看看 MongoDB Atlas Vector Search (Risk 3.0)如何帮助增强现有的欺诈检测方法。
Mongo Vector Search 如何提供帮助
矢量数据库是一种有组织的信息集合,可以更轻松地找到不同数据之间的相似性和关系。与使用独立或附加的矢量数据库相比,这一定义使 MongoDB 具有独特的高效性。MongoDB 开发人员数据平台的多功能性使用户能够将其操作数据、元数据和矢量嵌入存储在 MongoDB Atlas 上,并无缝使用 Atlas Vector Search 来索引、检索和构建高性能的 gen AI 应用程序。
实时分析和向量搜索的结合提供了强大的协同作用,使组织能够发现传统方法无法发现的见解。MongoDB 通过与 OpenAI 嵌入集成的 Atlas Vector Search 实现了这一点,如下图 1 所示。
图 1:Atlas Vector Search 在欺诈检测和反洗钱方面的实际应用
商业视角:欺诈检测与反洗钱
在深入研究向量嵌入的使用之前,了解推动欺诈检测和反洗钱的不同业务目标和运营流程至关重要。
欺诈检测的 核心是识别那些通过欺骗手段获取即时经济利益的未经授权的活动。因此,检测模型会在交易数据中寻找表明此类活动的特定模式。例如,它们可能专注于高频、低价值的交易,这是欺诈行为的常见指标。另一方面, 反洗钱的 目标是掩盖非法资金来源的复杂过程。这里的模型分析更广泛、更复杂的交易网络和行为,以识别潜在的洗钱活动。例如,反洗钱可以研究较长时期内交易与实体之间的关系。
为欺诈和反洗钱创建向量嵌入
欺诈和反洗钱模型需要不同的方法,因为它们针对不同类型的犯罪活动。为了准确识别这些活动,机器学习模型使用针对每种检测类型的特征量身定制的向量嵌入。
在图 1 中突出显示的此解决方案中,使用文本、交易和交易对手数据的组合来创建用于欺诈检测的向量嵌入。相反,用于 AML 的嵌入是根据交易数据、交易对手之间的关系及其风险状况生成的。可以自定义数据源的选择,包括使用非结构化数据和创建一个或多个向量嵌入,以满足特定需求。此特定解决方案利用 OpenAI 来生成向量嵌入,但也可以使用其他软件选项。
历史向量嵌入 是将过去的交易数据和客户资料编码为向量格式的表示。演示数据库预先填充了欺诈和反洗钱嵌入的合成测试数据。在实际场景中,您可以通过将历史交易数据和客户资料编码为向量来创建嵌入。
关于 欺诈和反洗钱检测工作流程 ,如图 1 所示,传入的交易欺诈和反洗钱聚合文本用于使用 OpenAI 生成嵌入。然后使用 Atlas Vector Search 根据被标记为可疑活动的具有相似特征的先前交易的百分比来分析这些嵌入。
在图 1 中,“已分类交易 ”一词 表示已被检测系统处理和分类的交易。此分类有助于确定交易是否被视为正常、潜在欺诈或表明存在洗钱行为,从而指导进一步的行动。
如果被标记为欺诈:交易请求被拒绝。
如果没有标记:交易已成功完成,并显示确认消息。
对于被拒绝的交易,用户可以使用交易参考号联系案件管理服务以获取详细信息。成功的交易无需采取任何行动。
结合Mongo Atlas Vector Search 进行欺诈检测
通过使用带有 OpenAI 嵌入的 Atlas Vector Search,组织可以:
消除预测(风险 2.0)方法所需的批量和手动特征工程的需要。
动态整合新数据源以执行更准确的语义搜索,应对新出现的欺诈趋势。
对于移动解决方案,请采用此方法,因为传统方法通常成本高昂且性能要求高。
为什么 MongoDB 可以用于反洗钱和预防欺诈
欺诈和反洗钱检测需要整体平台方法,因为它们涉及不断变化的各种数据集。客户选择 MongoDB 是因为它是一个统一的数据平台(如下图 2 所示),无需使用专用矢量数据库等小众技术。
此外,MongoDB 的文档数据模型可以包含任何类型的数据 - 任何结构(结构化、半结构化和非结构化)、任何格式、任何来源 - 无论其变化频率如何,都可以让您创建客户的整体图景,以便更好地实时预测交易异常。
通过整合 Atlas Vector Search,机构可以:
构建由针对任何类型数据的语义搜索和生成式 AI 驱动的智能应用程序。
将向量嵌入存储在源数据和元数据旁边。数据库中插入或更新的向量会自动同步到向量索引。
使用搜索节点 优化资源消耗、提高性能并增强可用性 。
通过久经考验、完全托管的 MongoDB Atlas 开发人员数据平台消除繁重的运营工作。
图2:统一风险管理和欺诈检测数据平台
鉴于欺诈检测和反洗钱的广泛性和不断发展性,这些领域通常需要多种方法和多模式方法。因此,统一的风险数据平台为旨在构建有效解决方案的组织提供了多种优势。使用 MongoDB,您可以单独或组合开发 Risk 1.0、Risk 2.0 和 Risk 3.0 的解决方案,以满足您的特定业务需求。
这些概念通过两个示例进行了演示: Risk 1.0 和 Risk 2.0 的 信用卡欺诈解决方案加速器以及 Risk 3.0 的新 向量搜索解决方案 ,如本博客中所述。值得注意的是,基于向量搜索的 Risk 3.0 解决方案可以在 Risk 1.0 和 Risk 2.0 之上实施,以提高检测准确性并减少误报。
原文链接:https://www.mongodb.com/blog/post/anti-money-laundering-fraud-prevention-mongodb-vector-search-openai
原文作者:Ainhoa Múgica、Shiv Pullepu、Jack Yallop和Paul Claret
本文由 mdnice 多平台发布