蚂蚁智能内容合规审核产品探秘

news2025/1/15 23:49:25

随着互联网服务的不断深化,产品营销的形式从传统文本、长图文,增加到短视频、直播等新媒介形态,展现形式愈加丰富的同时,也为营销宣传内容合规审核带来了诸多难题。

  • 如何解决与日俱增的审核量与合规审核人员有限之间的矛盾?

  • 如何提升审核效率,满足业务部门快速发布需求?

  • 对于音视频、直播,如何对这些新媒介形式实现高效高质量的审核?

基于上述挑战,蚂蚁数科推出了全栈式智能内容合规审核平台产品。该产品基于AI智能技术及专业内容审核规则沉淀,向金融、互联网、政企、传媒等行业客户提供一站式智能内容合规审核解决方案,可助力机构有效降低营销合规风险…

值得一提的是,蚂蚁集团与博时基金共建的基金内容合规智能审核系统是国内的领先实践,荣获了第八届证券期货科学技术奖优秀奖和2021年度深圳市金融创新奖三等奖。该审核系统具备高度自主知识产权,处于国内外领先水平。

一、产品能力

合规专家人力有限,越来越无力支撑海量内容的人工审核,且人工风险排查存在排查标准不统一,风险挖掘不深入,评审结果无沉淀等一系列问题。

蚂蚁智能审核产品基于人工智能技术及专家经验的解读和沉淀,提供了一站式的营销合规风险管控解决方案,将监管要求进行数字化转译,通过程序化手段实现快速的机审策略配置;同时提供了统一审核服务接入,支持文本、图片、语音、视频、直播、文件等全媒体格式的营销宣传内容识别,结构化内容特征,进行规则推理,完成风险决策和处置。

多媒体内容识别

支持全媒体格式处理,适用于企业级推销产品或服务的文字、图片、音频、视频、直播或其他内容展示形式,以实现针对用户可感知的应用页面、营销宣传、金融产品信息、销售行为过程等内容的全媒体格式的智能审核。

智能内容审核

合规专家会将自己的审核经验总结成规则或违规风险点,基于特定审核场景,融合各类算法模型构建复杂且精准的策略体系,打造感知引擎-认知引擎-决策引擎为核心的多媒介金融风险精细化审核引擎,达成以机器审核代替人工审核的目标。

二、技术内幕

1.多媒体内容识别

在内容审核的过程中,针对不同的内容往往需要采用不同的处理方式来达到审核的目的。日常遇到的内容包括营销广告、产品页面文案、启动屏、IM、电销、直播、超链接、氛围图、弹窗、信息流、PUSH、短信、邮件等各种面向消费者的信息展示形式,这些内容大多以各种素材类似一张图片/一段音频/一段视频等方式承载。内容处理中心服务于审核前的内容预处理环节,即从这些素材中提取出需要审核的信息,进行内容转换、抽取、压缩等。

1.1基础能力建设:

o 文件处理:提供文件内容抽取、文件类型转换、文件生成图片等多种文件处理功能。

o 图片处理:提供图片压缩、智能切割、图像增强、降噪处理等多种图像处理能力。

o 音视频处理:提供音视频转码,视频抽帧,音频文件提取,语音ASR、增强、降噪等多种能力。

1.2 复杂处理流程编排:为了应对灵活多变的内容处理流程,内容处理中心支持自定义内容处理流程编排,针对不同场景通过自定义脚本的方式实现内容处理节点的灵活编排。譬如为了满足复杂监管要求,当视频中语音涉及产品业绩介绍时,视频页面应当播放业绩展示板,通过自定义脚本的方式实现视频抽音频后,识别其中关键内容,再抽取对应时间图片,进行联合送审。

2.智能内容审核及规则编排

为识别更复杂且隐蔽的金融风险问题,提升合规风险识别的准确率和召回率,我们建设了感知&认知&决策三层漏斗式处理引擎。同时建立统一算法能力接入平台,实现原子算法能力业务无感插拔。最后在调用节点的输入输出之间加入了工程能力介入,如灰度图等,以增强算法模型的识别能力。

与天生具备自然属性的概念不同,监管合规概念是由社会活动的演进而出现,再由相关监管部门进行定义与规范的,专家会将自己的审核经验总结成规则或违规风险点,机审则需要对这些规则进行算法实现,规则生产配置的过程其实就是将一项项专家经验转换成机审能力的过程。在这个过程中,规则数量大,需要覆盖的场景多,为每条规则研发一个脚本工作量大,后期维护成本高昂。同时在研发规则脚本时,发现很多规则是有相似的处理逻辑的,且具备一定顺序性,由此提炼原子能力,设计出一套规则的编排方案,快速实现业务规则,同时在规则发生调整时可快速切换组合方式,同时可以基于简单的配置化,做到业务的快速接入和使用。

3.模型迭代优化

审核中算法模型的优化迭代更新依赖大量的标注样本。在内容合规领域,没有成熟、直接可用的样本集,强依赖合规专家经验的持续输入,然而合规专家打标的人力成本和时间成本都非常高昂,因此如何降低打标成本是内容合规领域的重中之重。围绕着这个问题,我们采用了小样本学习、主动学习、噪声学习等技术,在打标环节筛选高质量的样本,节省专家时间的同时使算法模型达到业务要求的精度,提高人在回路体系的效率。

以小样本学习为例,我们使用大规模预训练语言模型,使用NLP的prompt(模板填充)模式,结合半监督学习,充分利用未打标样本,能够在样本量减少一半的情况下,模型效果保持不变。在特定任务中,样本量能减少到原先的1/5。在这套框架下,“人”、“数据”、“模型”三者是互相提升的,数据在整个回路里从未标注变成强标注,人从对审核规则有初步理解变成审核方面的专家,模型从无监督到强监督。

三、落地案例

博时基金-蚂蚁智能审核样板间 丨通过AI技术,实现基金产品销售素材智能化审核服务

蚂蚁智能审核产品一直以来致力于为用户提供智能内容合规审核能力,与行业共建合规规则库,持续优化更新。在基金产品宣传材料方面,博时基金引入了蚂蚁集团智能合规审核服务,构建博时基金内容管理与智能审核平台。 智能审核能力提升了合规审核效率,降低合规风险,大幅优化了业务-合规审核流程。内容管理平台提供营销素材存储、管理、复用、共享服务,助力不同素材需求方快速获取审核通过的定稿素材,提升营销品宣效率。

博时基金与蚂蚁共建的智能审核系统还具备以下两大特点:

技术创新点:基于深度神经网络框架,运用大规模预训练、多模态识别、人在回路算法等技术构建了国内领先的金融合规模型集群,将合规专家经验转化为智能审核能力,解决了复杂语境下的准确率和审核效率问题。

业务创新点:围绕内容生命周期,部署全流程的合规管理应用场景,并创造性实现了人机结合应用界面,创新实现视频直播类智能合规审核,从“0到1”的突破。

目前蚂蚁集团智能合规内容审核产品已开始向基金、保险、银行等金融机构推广落地。

四、未来展望

目前,智能审核产品已经广泛应用在包括蚂蚁保、蚂蚁基金、网商银行、博时基金等多家机构,持续帮助机构定位与洞察合规业务风险,提升业务协同效率。同时蚂蚁智能审核产品现已向金融机构提供商业化服务,期待与更多机构共建行业合规规则库,开展合规领域大模型的构建和应用实践,进一步提升智能化水平。

后续我们会持续分享蚂蚁集团智能合规内容审核能力演进过程中的落地与思考,欢迎大家提出任何意见与建议。

如有兴趣,可以联系:gengliu.gl@antgroup.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/162470.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【阶段三】Python机器学习31篇:机器学习项目实战:基于皮尔逊相关系数搭建电影智能推荐系统

本篇的思维导图: 项目背景 在当今这个大数据时代,智能推荐系统的应用越来越广泛,网上购物、在线观影、新闻推送的背后都有智能推荐系统算法的支持。人们经常会在视频平台上观看电影,有时明确想要观看某部电影,有时则仅仅是随机搜寻。如果视频平台能利用基于物品的…

DDOS攻击

把我掘金的文章同步一份过来 最近网上爆火的一款游戏 Goose Goose Duck (鹅鸭杀) 游戏官方在近日发布了一则公告,宣布由于服务器屡次遭受黑客攻击,该游戏服务器将暂时关服三天进行维护 遭到了DDOS攻击,背后原因,我们不做讨论&…

代码随想录算法训练营第十七天二叉树 java : . 110.平衡二叉树 257.二叉树的所有路径 404.左叶子之和

文章目录前言Leetcode 110.平衡二叉树题目讲解思路Leetcode 257. 二叉树的所有路径题目讲解这道题涉及到了回溯Leetcode 404.左叶子之和题目讲解总结前言 选择一个简单的理念,矢志不渝地去执行(Take one simple idea and take it seriously 递归三部曲…

【Nginx】Nginx搭建高可用集群

1. KeepalivedNginx 高可用集群(主从模式)2. 配置高可用的准备工作3. 在两台服务器上安装keepalived4. 完成高可用配置(主从配置)5. 最终测试 1. KeepalivedNginx 高可用集群(主从模式) 2. 配置高可用的准备工作 需要两台服务器…

Revit如何将明细表导出为DWG格式【批量导出图纸】

一、Revit中怎样将明细表导出到DWG文件中 有时需要将Revit中生成的各种明细表导入到CAD中使用,但是在明细表视图中并没有导出成DWG格式的选项如图1所示,应该如何操作才能导出成CAD可识别文件呢? 方法一:将明细表通过导出为报表选项…

Java 核心技术卷 I 基础知识笔记(一)

Java 的基本程序设计结构 2.1 一个简单的 Java 应用程序 一个最简单的 Java 应用程序,它只发送一条消息到控制台窗口中:/*** This is the first sample program in Core Java Chapter 3* version 1.01 1997-03-22* author Gary Cornell*/ public class…

分享111个Java源码,总有一款适合您

Java源码 分享111个Java源码,总有一款适合您 源码下载链接:https://pan.baidu.com/s/1fycjYHA7y6r-IH8H7v5XKA?pwdag8l 提取码:ag8l 下面是文件的名字,我放了一些图片,文章里不是所有的图主要是放不下...&#xff…

网络编程学习记录

服务端首先是确定协议版本。首先定义一个结构体 WSADATA wsadata; 这个结构体是啥呢? 是Windows下得到广泛应用的、开放的、支持多种协议的网络编程接口。大家晓得了吧。 让我们看看这个结构体。 typedef struct WSAData {WORD wVersion; …

c++ socket之io复用模型 epoll进阶

服务器开发系列 文章目录服务器开发系列前言一、socket epoll介绍二、代码实现1. epoll client实现2. epoll server实现3. epoll client server验证总结前言 I/O复用模型:主要是指,一个线程可以同时监控多个系统IO、并且能够操作多个系统IO的一种技术模…

西瓜书第一章课后题答案(一)

1.1 针对西瓜分类分题进行讲解属性: 3个属性色泽:(青绿,乌黑,浅白)根蒂:(蜷缩,硬挺,稍蜷)敲声:(浊响,清脆&…

Docker网络network详解

一、概述 Docker容器每次重启后容器ip是会发生变化的。 这也意味着如果容器间使用ip地址来进行通信的话,一旦有容器重启,重启的容器将不再能被访问到。 而Docker 网络就能够解决这个问题。 Docker 网络主要有以下两个作用: 容器间的互联和…

【ROS2入门】理解 ROS 2 节点

大家好,我是虎哥,从今天开始,我将花一段时间,开始将自己从ROS1切换到ROS2,在上一篇中,我们依托Turtlesim演示节点来逐步展开,介绍了rqt工具,这一章,我们将围绕ROS2中主要…

jvm快速入门

1.JVM介绍 1.什么是jvm Java Virtual Machine(java二进制字节码运行环境) 好处: 一次编译,好处运行自动内存管理,垃圾回收机制数组下标越界检查多态 比较JVM\JRE\JDK jvm屏蔽java代码与底层操作系统的差异 JREJVM基…

基于 java springboot+layui仓库管理系统设计和实现

基于 java springbootlayui仓库管理系统设计和实现 博主介绍:5年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java毕设项目精品实战案例《500套》 欢迎点赞 收藏 ⭐留言 文末获取源码…

基于基于jsp+mysql+Spring+mybatis的SSM汽车保险理赔管理系统设计和实现

基于基于jspmysqlSpringmybatis的SSM汽车保险理赔管理系统设计和实现 博主介绍:5年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java毕设项目精品实战案例《500套》 欢迎点赞 收藏 ⭐…

12图、网络、关联矩阵

第 12 讲 图、网络、关联矩阵 Graphs,networks,incidence matrices 本讲讨论线性代数在物理系统中的应用。 图和网络 Graphs & Networks “图”就是“结点”和“边”的一个集合。 边线上的箭头代表从结点流出的正方向。 关联矩阵(I…

独立开发变现周刊(第87期):靠写简历如何每年赚24万美元?

分享独立开发、产品变现相关内容,每周五发布。目录1、mall4cloud: 开源的微服务B2B2C电商商城系统2、restorePhotos:开源的老照片修复系统3、JSON Crack——开源、免费的JSON可视化应用程序4、靠写简历如何每年赚24万美元?1、mall4cloud: 开源…

干货:用户分析的六大方法论(一)

​在日常的用户分析中,常用的有六大分析方法论: 1、行为事件分析2、点击分析模型3、用户行为路径分析4、用户健康度分析5、漏斗模型6、用户画像分析 1.行为事件分析 “行为事件分析”是用户分析的第一步,也是用户分析的核心和基础。一般来说…

代码随想录训练营第五十九天

1.下一个更大元素II 题503 循环数组有两种方法&#xff0c;一是用同一个数组拼接成两个数组&#xff0c;实现假循环&#xff1b;二是遍历两遍&#xff0c;用求余的方法。求余的方法更简便。 class Solution { public:vector<int> nextGreaterElements(vector<int>…

虚拟化技术学习笔记9

KVM存储虚拟化配置&#xff1a; 学习目标&#xff1a; 能够通过virt-manager添加硬盘&#xff1b;能够通过virsh添加硬盘&#xff1b;能够通过xml文件添加硬盘&#xff1b;能够了解本地存储的作用&#xff1b;能够设置本地存储&#xff1b;能够了解网络存储的作用&#xff1b…