数澜科技公益案例
本项目案例由数澜科技投递并参与数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2023中国数据智能产业最具社会责任感企业》榜单/奖项”评选。
大数据产业创新服务媒体
——聚焦数据 · 改变商业
近年来,智慧检务已成大势所趋,《“十三五”时代科技强检规划纲要》确立了检察机关“感、传、知、用、管”五维一体的智慧检务应用体系总目标,并明确“逐步搭建大数据支撑环境,逐步开展大数据应用,为’智慧检务‘奠定基础的检察大数据建设任务,营造大数据应用良好生态,提升司法办公质量。
为解决公益诉讼线索发现来源渠道单一、线索转化效率低的难题,数澜科技与温州市人民检察院合作,把信息技术深度融入检察改革、司法办案、检务公开等多个层面,引入文本AI处理引擎,融合各平台线索数据,最终研发公益诉讼线索智能研判预警系统。此系统通过集成线索数据库、预警地图、统计分析数据的功能设置,将海量碎片化且无序排列的信息变成有用、有序的数据,实时掌握线索分布动态,实现了对公益诉讼线索挖掘、聚类、处置、立案的智能识别与处置跟踪,保障了公益诉讼线索的发现率和实时性,提高了办案部门工作效率,有效满足了相关群众的公益诉讼诉求,形成了一套完善的公益诉讼业务处置机制,推动社会的公平正义和法治建设,对于社会公益具有广泛的推广意义。
公益诉讼线索智能研判预警系统中的公益诉讼线索的快速识别、自动分流、评估研判、集中展示、智能预警等智能化应用,使得原先需要3名干警花费两个月时间从几万条热线举报和行政执法信息中筛选出有价值的 50 多条初步线索的工作缩短为十几秒,实现质的飞跃。据悉,此系统的应用减少80%的人工分类工作量,有效线索获取效率提升95%以上。
此案例已获得2020年浙江省智慧检察创新应用设计大赛中获评“十佳设计方案”、2021年法治日报社“智慧司法创新产品”等6项荣誉,并于2021年获中国信息通信研究院、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)评选的行业大数据优秀应用案例星河奖。
时间周期:
开始时间:2018年04月02日
截止时间:至今
服务周期:服务中
应用场景
在温州检察院内部业务流程及场景中的应用场景为数澜数栖平台结合深度学习AI处理能力(NLP及实体识别等技术)对各类线索源、裁决文书数据进行结构化处理,提取关键特征统一构建检务数据资产体系,挖掘多源线索,建立检察院“用数据分析、用数据执法”的机制,为执法监督构建“一个数据能力中心、多个业务数据应用”的“1+N”检务能力中心建设模式,实现检务数据进行标准化开发、统一化管理、深度整合、共享及场景化的应用,全面实现智能辅助办案,提升智慧案件管理水平,满足了相关群众的公益诉讼诉求,帮助维护公共利益,促进社会的良性发展。
该技术方案对整个公检法系统中的应用规模:除公益诉讼线索智能研判预警系统项目外,深度学习AI处理能力(NLP及实体识别等技术)已应用到温州检察院“在线监察监督系统”、“虚假诉讼违法监督系统”、“行政执法监督系统”以及瑞安检察院“刑事案件精准化办理智能辅助系统”中。
面临挑战
温州市人民检察院之前的应用系统的设计以业务流程为基础,应用目标主要为提高工作效率、积累工作数据等,关注信息化应用,满足特定业务流程的合理性和顺畅性,以业务流程的数据为分析基础,最终反哺业务,辅助分析。
公益诉讼制度是中国经济和社会发展的结果,随着司法体制改革对检察院的角色定位有了新的要求,检察机关需要行使公益诉讼的检察权和监督权。当前,面向公益诉讼领域,行使公益诉讼的检察权和监督权还处于探索阶段,检察机关普遍存在跑线索、要线索、等线索的被动局面,具体存在的问题表现为如下几个方面:
1、数据存在孤岛化:各业务系统加工出的数据,仅存于当前业务系统中,无法被其他业务场景所使用,成为数据孤岛。
2、数据血缘难追溯:数据加工的过程无法感知,想知道数据在哪一步发生了什么变化,无从下手。
3、应用效果感知差:业务系统的使用效果不容易进行评估,哪些数据使用频率高,哪些数据需要重点关注,无法感知。
4、公益诉讼线索收集困难:大多数检察机关处于被动接受公益诉讼线索的状态,普遍获取线索渠道比较狭窄,限于控申举报、办案过程中发现等渠道。公益诉讼类型案件,多是由民众发现污染企业并进行呼吁,造成大流量的舆论关注后才会有相关团体或部门来解决问题,难以保障公益诉讼线索的发现率和实时性。
5、公益诉讼线索分析困难:针对同一线索、事件在信访局热线当中会有多方投诉、多个用户产生的表述,承办人很难将相似的内容聚合分析。而且面对海量数据,依靠人工较难分析民众针对某一线索事件的走势。
6、公益诉讼办案过程繁琐:从检察官业务办理方面,存在着线索挖掘难,线索分流慢,办案效率低等问题,难以有效满足相关群众的公益诉讼诉求。
7、检察机关人员人力不足:当前检察机关人员少,工作任务重,目前民行部门检力资源少,日常精力都花在传统案件办理上。无法过多投入精力收集、分析线索。公益诉讼类型案件涉及跨领域知识内容(环境、食药),办理案件学习成本较高。承办人还需要面对取证、检测、鉴定等一系列问题。
因此迫切需要应用大数据和智能辅助工具来改变案件办理模式,实现自动化线索发现、流转、处置、预警闭环,进一步提升检务工作的科学、法治、高效。
技术开发过程
一、总体建设思路
1、建设目标
构建温州检察院公益诉讼智能研判系统,为基层院/市本级提供线索研判服务,为省院和市院提供跟踪、监管线索研判效果的服务,帮助检察院提升公益诉讼立案和行政执法监督立案效率,两类用户的业务目标包括:
① 基层院/市本级:提供线索研判服务,提升公益诉讼立案效率。
② 省院/市院:提供线索处理跟踪,提升监管线索研判效果的工作效率。
2、建设思路
总体建设思路
温州检察院公益诉讼智能研判系统,采用语义分析和机器学习等大数据技术,对12345政务服务热线投诉信息进行结构化处理,将原有的无使用价值的非结构化投诉数据转化为结构化、标准的、可供业务人员使用的线索信息。针对涉案领域、监管部门、违法事实(时间、地点、事件)、处置结果等关键文本进行提取,将相似的投诉信息归类为五大领域的线索,实现线索信息从采集到分析、归类、推送的快捷处理,减轻人工筛选公益诉讼线索的工作量。
二、项目解决方案
温州检院公益诉讼线索研判系统具体解决方案如下:
1、投诉线索汇聚
基于平台的数据交换能力,汇聚12345政务服务热线及行政执法处罚系统数据,实现数据互联互通,打破原有数据孤岛。
2、投诉信息关键特征值提取
利用【深度学习命名实体识别】对汇聚的政务服务热线数据中投诉主体、行政管辖、违法事实等关键特征,实现线索解构处理,构建公益诉讼数据资产体系,为后续线索研判提供有效的数据支撑。
3、线索智能归类
基于提取的关键特征值,利用【线索智能归类模型】剔除与公益诉讼无关及重复的线索,实现线索分类。按照知识库中指定的五大领域(生态环境保护、食品药品安全、国有资产保护、国有土地出让权、英烈保护),智能识别归类出有效的线索,减少人工分类的工作量及错误率。
4、线索智能关联聚焦
采用文本匹配算法,系统对全量的线索自动对比碰撞,将投诉热线信息与行政处罚系统相似线索自动关联计算,实现线索智能串联,为线索处理提供辅助决策。
5、智能分流推送
通过【线索智能分流推送规则】按照有效线索所属管辖区域,自动分流推送至被投诉对象对应的基层检察院,并且针对有效线索涉及多管辖区域的情况,支持通过人工分流的方式实现线索分流至基层检察院。
6、数据建设内容
本期数据建设数源主要来源于省信访局12345政务服务热线系统投诉数据以及苍南院-行政处罚平台数据,涉及到原始表有4张(12345信访原始数据,行政处罚原始数据,地区维表,违法事实分类维表),每天处理任务数10余项。
三、具体技术实现
公益诉讼线索研判技术处理流程图
1、算法设计
算法中主要实现了线索分类计算、地名识别、线索与线索以及线索与案件关联的处理。
(1)分类算法设计
a.基于关键词进行文本分类
统计并人工整理每个类别的关键词,且部分词能有效的进行组合,确保分类的准确性,如“土地”和“倒卖”等。
b.基于深度学习textCnn进行文本分类
TextCNN是利用卷积神经网络对文本进行分类的算法,卷积具有局部特征提取的功能,所以可用CNN来提取句子中类似n-gram的关键信息。与图像等处理方法不同的是图像是二维数据,经过词向量表达的文本为一维数据,因此在TextCNN卷积用的是一维卷积。
(2)地名识别设计
a.建立三级地名库,不包含温州市这个等级
b.提取句子中包含的最长的地名,防止出现截断式地名
c.抽取地名流程如下:
(3)关联算法设计
a.12345内部关联算法实现
● 基于规则截取出线索中的事件信息;
● 基于词性和去停用词处理去除事件信息中的冗余信息,形成词向量;
● 基于相同地名和分类(即领域)进行第一次线索聚类;
● 在已经分类的信息中基于文本相似度计算进行线索的二次聚类,并得出相关线索。
b.12345和行政执法之间关联计算方法实现
● 基于规则截取出线索中的事件信息;
● 基于词性和去停用词处理去除事件信息中的冗余信息,形成词向量;
● 由于每一条12345的数据都要与行政执法的数据进行计算,将条件限制在相同的分类上,以此减少计算量;对相同分类以及部分关键词(提取的领域关键词)相同的信息进行相似度计算,设置阈值,得出与12345相关的一些行政执法案件。
2、部署架构设计
从部署的计划上,并考虑到尽量节省温州市政务云资源,我们将前后端应用服务器部署在同一机器上,并采用一台机器用于算法、数据计算、存储,第三台机器用于部署应用测试环境,同时业务数据库采用云数据库统一管理。
四、解决方案亮点
该平台通过建立“民生热线+ 执法数据+检察监督”三位一体公益诉讼线索发现机制,加强数据共享、 信息采集、筛选流转、评估研判、分类预警,从而解决公益诉讼线索发现难、转化难、管理难的问题。
实现数据共享、信息采集、筛选流转、评估研判、分类预警能力的提升,从而解决公益诉讼线索发现难、转化难、管理难的问题;通过集成线索数据库、预警地图、统计分析数据的功能设置,实时掌握线索分布动态,实现公益诉讼线索的快速识别、自动分流、评估研判、集中展示、智能预警等智能化应用,进一步解决线索转化和管理问题;通过汇集公益诉讼数据,统一构建检察院数据资产体系,对诉讼来源、过程、结果进行深度挖掘、分析,建立“用数据分析、用数据执法”的机制,为诉讼执法监督提供支撑、为法治政府建设提供服务。
具体亮点如下:
1、公益诉讼线索处理全链路整合
将线索获取、有限线索筛选、线索关联、线索智能分流、线索处理反馈等办案过程全链路打通。
2、线索数据自动同步
基于数栖平台基础支撑能力,自动化抽取12345热线线索与行政执法线索、替代人工操作。
3、有效线索智能筛选
基于深度学习的文本分类算法,对海量热线线索自动识别、筛选,获取公益诉讼相关线索。
4、线索处理反馈
采用自动化的线索处理进度跟踪流程,系统实时跟进自动分流线索、待分流线索、接收线索、立案线索、不立案线索。
5、线索关联辅助
系统对全量的线索自动对比碰撞,将相似投诉信息自动增量关联为线索,分析线索的投诉次数、人数、持续投诉时间以及发展态度,协助办案人员获知线索办理优先级。
6、统计分析,洞察有效线索
按涉案领域、监管部门、违法事实等多维度深度解析,同时提供领先可视化展示方式实现全局洞察。
该技术方案对整个公检法系统中的应用规模:除公益诉讼线索智能研判预警系统项目外,深度学习AI处理能力(NLP及实体识别等技术)已应用到温州检察院“在线监察监督系统”、“虚假诉讼违法监督系统”、“行政执法监督系统”以及瑞安检察院“刑事案件精准化办理智能辅助系统”中。
应用效果/社会价值
一、应用效果
在温州检察院内部业务流程及场景中的应用场景:数澜数栖平台结合深度学习AI处理能力(NLP及实体识别等技术)对各类线索源、裁决文书数据进行结构化处理,提取关键特征统一构建检务数据资产体系,挖掘多源线索,建立检察院“用数据分析、用数据执法”的机制,为执法监督构建“一个数据能力中心、多个业务数据应用”的“1+N”检务能力中心建设模式,实现检务数据进行标准化开发、统一化管理、深度整合、共享及场景化的应用,全面实现智能辅助办案,提升智慧案件管理水平。
自公益诉讼线索智能研判预警系统运行以来,截止当前已收集23万余条的信息,评估并自动分流有效线索6万余条,紧急预警线索5000余条。
系统未上线以前,温州地区公益诉讼立案数92件,发出行政诉前检察建议65件,提起刑附民公益诉讼2件。2018年7月系统上线后,当年的7月-12月共立案数880件,发出行政诉前检察建议773件,提起刑附民公益诉讼18件,整体检察建议数和公益诉讼立案数相较都实现了质的飞跃。整体减少80%的人工分类工作量,有效线索效率提升95%以上。
同时,原先3名干警需花费两个月时间,从几万条热线举报信息和行政执法信息中筛选出有价值的50多条初步线索,如今同样的工作只需耗时十几秒。
公益诉讼线索研判系统上线之后,获得浙江全省检察机关十佳创新应用并推广至浙江全省,温检项目组成员同时获得18年度集体二等功的优秀荣誉。
二、社会价值
“公益诉讼线索智能研判预警系统项目”,旨在解决公益诉讼线索发现来源渠道单一、线索转化效率低的难题,温州市院携手大数据合作伙伴数澜科技,引入文本AI处理引擎,融合各平台线索数据,研发公益诉讼线索智能研判预警系统,将海量碎片化且无序排列的信息变成有用、有序的数据,解决人工信息处理模式分流筛选速度慢、有效线索提取效率低的弊端,也解决了公益诉讼线索发现难、转化难、管理难的问题,极大地提升了办案人员的办案效率和办案能力。
数澜利用数栖平台基于场景化应用建设,形成具有检务特色的数据资产体系,形成检察行业数据标准、数据安全体系、数据目录以及标签管理体系,实现数据全生命周期的资产化管理,安全的资源隔离、权限控制审计日志等,提高数据安全性,加强技术安全与数据隐私保护;建立数据共享机制,打破数据孤岛,实现数据高效共享。助力温州市人民检察院通过法律手段促进社会公平正义,保护弱势群体的权益,改善社会环境。
该技术方案对整个公检法系统中的应用规模:除公益诉讼线索智能研判预警系统项目外,深度学习AI处理能力(NLP及实体识别等技术)已应用到温州检察院“在线监察监督系统”、“虚假诉讼违法监督系统”、“行政执法监督系统”以及瑞安检察院“刑事案件精准化办理智能辅助系统”中。
关于企业
·数澜科技
数澜科技成立于2016年6月20日,是一家专业的数据应用基础设施供应商,秉持“让数据用起来”的使命,以一站式数据中台搭建基础设施“数栖”产品为核心,数据中台解决方案、数据可视化服务、数据智能解决方案等产品矩阵,为政府、企业提供咨询、技术支持、实施落地等一站式数据资产化与应用服务,助力客户商业智能创新。目前,数澜科技旗下产品已广泛应用于军工、政府、地产、金融、制造、教育等领域。点击文末“阅读原文”链接,还可了解更多“数澜科技”信息。
·温州市人民检察署
温州市人民检察署于1950年12月成立,1981年11月,原市院并入温州分院,成立现在的温州市人民检察院。温州市人民检察院下辖鹿城区、龙湾区、瓯海区、瑞安市、乐清市、苍南县、永嘉县、平阳县、洞头县、文成县、泰顺县等基层院。
★以上由数澜科技投递申报的项目案例,最终将会角逐由数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2023中国数据智能产业最具社会责任感企业》榜单/奖项。
该榜单奖项最终将于11月14日以下活动中进行榜单的首发与奖项的颁发,欢迎报名莅临现场: