蚂蚁智能内容合规产品,提供一站式营销合规管控解决方案

news2024/11/28 20:53:31

随着互联网服务的不断深化,产品营销的形式从传统文本、长图文,增加到短视频、直播等新媒介形态,展现形式愈加丰富的同时,也为营销宣传内容合规审核带来了诸多难题。

  • 如何解决与日俱增的审核量与合规审核人员有限之间的矛盾?

  • 如何提升审核效率,满足业务部门快速发布需求?

  • 对于音视频、直播,如何对这些新媒介形式实现高效高质量的审核?

基于上述挑战,蚂蚁数科推出了全栈式智能内容合规审核平台产品。该产品基于AI智能技术及专业内容审核规则沉淀,向金融、互联网、政企、传媒等行业客户提供一站式智能内容合规审核解决方案,可助力机构有效降低营销合规风险。

此前,蚂蚁集团基于内部解语花平台与博时基金共建的基金内容合规智能审核系统荣获第八届证券期货科学技术奖优秀奖和2021年度深圳市金融创新奖三等奖。该审核系统具备高度自主知识产权,处于国内外领先水平。

一、产品能力

合规专家人力有限,越来越无力支撑海量内容的人工审核,且人工风险排查存在排查标准不统一,风险挖掘不深入,评审结果无沉淀等一系列问题。

蚂蚁智能审核产品基于人工智能技术及专家经验的解读和沉淀,提供了一站式的营销合规风险管控解决方案,将监管要求进行数字化转译,通过程序化手段实现快速的机审策略配置;同时提供了统一审核服务接入,支持文本、图片、语音、视频、直播、文件等全媒体格式的营销宣传内容识别,结构化内容特征,进行规则推理,完成风险决策和处置。

多媒体内容识别

支持全媒体格式处理,适用于企业级推销产品或服务的文字、图片、音频、视频、直播或其他内容展示形式,以实现针对用户可感知的应用页面、营销宣传、金融产品信息、销售行为过程等内容的全媒体格式的智能审核。

智能内容审核

合规专家会将自己的审核经验总结成规则或违规风险点,基于特定审核场景,融合各类算法模型构建复杂且精准的策略体系,打造感知引擎-认知引擎-决策引擎为核心的多媒介金融风险精细化审核引擎,达成以机器审核代替人工审核的目标。

二、技术内幕

1.多媒体内容识别

在内容审核的过程中,针对不同的内容往往需要采用不同的处理方式来达到审核的目的。日常遇到的内容包括营销广告、产品页面文案、启动屏、IM、电销、直播、超链接、氛围图、弹窗、信息流、PUSH、短信、邮件等各种面向消费者的信息展示形式,这些内容大多以各种素材类似一张图片/一段音频/一段视频等方式承载。内容处理中心服务于审核前的内容预处理环节,即从这些素材中提取出需要审核的信息,进行内容转换、抽取、压缩等。

1.1基础能力建设:

o 文件处理:提供文件内容抽取、文件类型转换、文件生成图片等多种文件处理功能。

o 图片处理:提供图片压缩、智能切割、图像增强、降噪处理等多种图像处理能力。

o 音视频处理:提供音视频转码,视频抽帧,音频文件提取,语音ASR、增强、降噪等多种能力。

1.2 复杂处理流程编排:为了应对灵活多变的内容处理流程,内容处理中心支持自定义内容处理流程编排,针对不同场景通过自定义脚本的方式实现内容处理节点的灵活编排。譬如为了满足复杂监管要求,当视频中语音涉及产品业绩介绍时,视频页面应当播放业绩展示板,通过自定义脚本的方式实现视频抽音频后,识别其中关键内容,再抽取对应时间图片,进行联合送审。

2.智能内容审核及规则编排

为识别更复杂且隐蔽的金融风险问题,提升合规风险识别的准确率和召回率,我们建设了感知&认知&决策三层漏斗式处理引擎。同时建立统一算法能力接入平台,实现原子算法能力业务无感插拔。最后在调用节点的输入输出之间加入了工程能力介入,如灰度图等,以增强算法模型的识别能力。

与天生具备自然属性的概念不同,监管合规概念是由社会活动的演进而出现,再由相关监管部门进行定义与规范的,专家会将自己的审核经验总结成规则或违规风险点,机审则需要对这些规则进行算法实现,规则生产配置的过程其实就是将一项项专家经验转换成机审能力的过程。在这个过程中,规则数量大,需要覆盖的场景多,为每条规则研发一个脚本工作量大,后期维护成本高昂。

同时在研发规则脚本时,发现很多规则是有相似的处理逻辑的,且具备一定顺序性,由此提炼原子能力,设计出一套规则的编排方案,快速实现业务规则,同时在规则发生调整时可快速切换组合方式,同时可以基于简单的配置化,做到业务的快速接入和使用。

3.模型迭代优化

审核中算法模型的优化迭代更新依赖大量的标注样本。在内容合规领域,没有成熟、直接可用的样本集,强依赖合规专家经验的持续输入,然而合规专家打标的人力成本和时间成本都非常高昂,因此如何降低打标成本是内容合规领域的重中之重。围绕着这个问题,我们采用了小样本学习、主动学习、噪声学习等技术,在打标环节筛选高质量的样本,节省专家时间的同时使算法模型达到业务要求的精度,提高人在回路体系的效率。

以小样本学习为例,我们使用大规模预训练语言模型,使用NLP的prompt(模板填充)模式,结合半监督学习,充分利用未打标样本,能够在样本量减少一半的情况下,模型效果保持不变。在特定任务中,样本量能减少到原先的1/5。在这套框架下,“人”、“数据”、“模型”三者是互相提升的,数据在整个回路里从未标注变成强标注,人从对审核规则有初步理解变成审核方面的专家,模型从无监督到强监督。

三、落地案例

博时基金-蚂蚁智能审核样板间 丨通过AI技术,实现基金产品销售素材智能化审核服务

蚂蚁智能审核产品一直以来致力于为用户提供智能内容合规审核能力,与行业共建合规规则库,持续优化更新。在基金产品宣传材料方面,博时基金引入了蚂蚁集团智能合规审核服务,构建博时基金内容管理与智能审核平台。 智能审核能力提升了合规审核效率,降低合规风险,大幅优化了业务-合规审核流程。内容管理平台提供营销素材存储、管理、复用、共享服务,助力不同素材需求方快速获取审核通过的定稿素材,提升营销品宣效率。

博时基金与蚂蚁共建的智能审核系统还具备以下两大特点:

技术创新点:基于深度神经网络框架,运用大规模预训练、多模态识别、人在回路算法等技术构建了国内领先的金融合规模型集群,将合规专家经验转化为智能审核能力,解决了复杂语境下的准确率和审核效率问题。

业务创新点:围绕内容生命周期,部署全流程的合规管理应用场景,并创造性实现了人机结合应用界面,创新实现视频直播类智能合规审核,从“0到1”的突破。

目前蚂蚁集团智能合规内容审核产品已开始向基金、保险、银行等金融机构推广落地。

四、未来展望

目前,智能审核产品已经广泛应用在包括蚂蚁保、蚂蚁基金、网商银行、博时基金等多家机构,持续帮助机构定位与洞察合规业务风险,提升业务协同效率。同时蚂蚁智能审核产品现已向金融机构提供商业化服务,期待与更多机构共建行业合规规则库,开展合规领域大模型的构建和应用实践,进一步提升智能化水平。

后续我们会持续分享蚂蚁集团智能合规内容审核能力演进过程中的落地与思考,欢迎大家提出任何意见与建议。

如有兴趣,可以联系:gengliu.gl@antgroup.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/166400.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

旧手机闲置?教你用Termux搭建个移动服务器

目录 前言 准备工作 实践 安装Termux: 运行Termux: 环境配置: 效果展示 写在最后 前言 最近偶然看到网上有人用KSWEB搭建本地服务器,于是突发奇想也想在手机中搭建一个node环境试试,趁着周末有空,…

Vue3商店后台管理系统设计文稿篇(五)

记录使用vscode构建Vue3商店后台管理系统,这是第五篇,主要记录Vue3项目路由知识 文章目录一、Vue3路由二、安装Element Plus三、NPM设置淘宝镜像四、Yarn 设置淘宝镜像正文内容: 一、Vue3路由 路由用于设定访问路径, 将路径和组件映射起来&…

【vue系列-06】vue的组件化编程

深入理解vue的组件一,vue组件1,什么是vue组件2,单文件组件和非单文件组件3,非单组件的基本使用4,vue组件命名规范4.1,一个单词组成4.2,多个单词组成5,组件与组件间的嵌套6&#xff0…

Tomcat结构体系

总体结构Tomcat中最顶层的容器是Server,代表着整个服务器,从上图中可以看出,一个Server可以包含至少一个Service,用于具体提供服务。Service主要包含两个部分:Connector和Container。从上图可以看出 Tomcat 的心脏就是…

opencv的mat openvino的tensor libtorch的tensor

opencv的mat 对于矩阵数据,在opencv里面是通过使用mat这个数据结构来实现的,我觉得这个数据结构本身设计是用来做图片的存储,所以很多的教程都是关于三维矩阵的(其中一个维度是channel),关于三维矩阵的定义…

通讯录小练习:柔性数组和文件操作实现

目录 一.程序功能 二.定义关键类型的头文件与枚举的应用 三.封装柔性数组的增容函数与缩容函数 四.添加联系人功能模块 五 .联系人信息打印模块 六. 查找指定联系人的模块 七.删除指定联系人模块 八.修改指定联系人信息模块 九.排序模块 九.文件操作模块 十.通讯录初…

如何实现外网远程登录访问jupyter notebook?

Jupyter Notebook是一个交互式笔记本,本质是一个 Web 应用程序,支持运行 40 多种编程语言,此前被称为 IPython notebook。Jupyter Notebook 便于创建和共享程序文档、支持实时代码、数学方程、可视化和 markdown,应用场景有数据清…

机器学习基础——k-近邻算法概述和简单实现

本章内容 k-近邻分类算法 从文本文件中解析数据 前言 众所周知,电影可以按照题材分类,然而题材本身是如何定义的?由谁来判定某部电影属于哪个题材?也就是说同一题材的电影具有哪些公共特征?这些都是在进行电影分类时必须要考虑的问题。没有哪个电影人…

Revit问题:降板表面填充图案和构件上色

一、Revit中如何为降板表面填充不同的图案 在平面图中该如何利用填充图案来区别降板跟楼板? 1、中间的楼板为降板(120)/-150mm,下面我们通过“过滤器”来为其填充表面图案。 2、通过快捷键VV打开“可见性/图形替换”对话框,单击选择“过滤器”一项。 3、…

2023/1 寒假期间自学c++计划安排

寒假一期学习总结 寒假一期学习是在线下进行的,总的来说,非常充实,也很有收获,成体系的学习了 二分,高精度,函数,结构体,STL 等等内容,既开心有学到了知识。 在这7天的集…

最新ios证书申请流程

苹果官方申请ios证书的方法,需要mac电脑,需要使用钥匙串管理先生成csr文件,然后去苹果开发者中心生成证书,然后再用mac电脑导出p12证书。假如我们没有mac电脑,又如何申请证书呢?这个教程我将教会大家如何使…

从汇编的角度了解C++原理——类的储存结构和函数调用

本文用到的反汇编工具是objconv,使用方法可以看我另一篇文章https://blog.csdn.net/weixin_45001971/article/details/128660642。 1、类的储存结构和函数调用 以这段代码为例。 编译后对obj文件反汇编,得到以下汇编代码,配合常量的值来分…

大数据技术架构(组件)——Hive:环境准备2

1.0.1.5、Mysql安装1.0.1.5.1、软件包下载解压缩官网或者直接从百度云盘中下载即可。https://dev.mysql.com/downloads/mysql/1.0.1.5.2、环境变量配置1.0.1.5.2.1、创建系统环境变量MYSQL_HOME1.0.1.5.2.2、将系统环境变量配置到Path上1.0.1.5.2.3、生成Data文件使用系统管理员…

【MySQL进阶教程】MySQL管理

前言 本文为 【MySQL进阶教程】MySQL管理 相关知识,下边将对系统数据库,常用工具(包括:mysql、mysqladmin、mysqlbinlog、mysqlshow、mysqldump、mysqlimport/source)等进行详尽介绍~ 📌博主主页&#xff…

开发微信小程序过程中遇到的问题笔记

时间绑定bindtap的基础用法 <view id"tapTest" data-hi"WeChat" bindtap"tapName"> Click me! </view>这里要注意的是data-xxx中的xxx需要小写&#xff0c;否则获取不到。 使用for循环的时候&#xff0c;这种方法是拿不到数据的。 …

系统分析师案例必备知识点汇总---2023系列文章三

系统设计 1、面向对象设计 分析类图是从用户的角度出发得到的业务“系统”&#xff0c;而设计类图更多的是从系统、软件的角 度来描述和表达系统。二者具体的区别&#xff1a; 分析类图&#xff1a;在需求分析阶段&#xff0c;类图是研究领域中的概念&#xff1b;分析类图主要…

C语言实现密码检查

这道题目并不算难&#xff0c;实现时可能会写出一些bug&#xff0c;需要耐心去调试。有两种方法&#xff0c;首先这些题目要求可以频繁使用字符串的库函数&#xff0c;这里不介绍这些库函数&#xff0c;我的方法是直接比较阿斯克码值的大小进行删选&#xff0c;频繁使用if语句。…

模板的补充

1. 非类型模板参数 模板参数分类类型形参与非类型形参。 类型形参即&#xff1a;出现在模板参数列表中&#xff0c;跟在class或者typename之类的参数类型名称。 非类型形参&#xff0c;就是用一个常量作为类(函数)模板的一个参数&#xff0c;在类(函数)模板中可将该参数当成…

【ElasticSearch01】ElasticSearch入门

目录1.数据类型2.Elasticsearch是什么3.全文搜索引擎4.Elasticsearch安装5.Restful和JSON6.Postman客户端工具7.倒排索引8.Elasticsearch基本操作8.1 索引操作8.1.1 创建索引8.1.2查询索引1.查询指定索引2.查询所有索引8.1.3删除索引8.2 文档操作8.2.1 创建文档8.2.2 创建文档时…

力扣 2287. 重排字符形成目标字符串

题目 给你两个下标从 0 开始的字符串 s 和 target 。你可以从 s 取出一些字符并将其重排&#xff0c;得到若干新的字符串。 从 s 中取出字符并重新排列&#xff0c;返回可以形成 target 的 最大 副本数。 示例 输入&#xff1a;s “ilovecodingonleetcode”, target “co…