【公益案例展】 温州市人民检察院——公益诉讼智能研判预警应用案例

news2024/11/26 14:50:30


97cfeaae210865e6bac3d0e5900b12ef.png

数澜科技公益案例

本项目案例由数澜科技投递并参与数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2023中国数据智能产业最具社会责任感企业》榜单/奖项”评选。

48adeaafa6c335d68c01d08c37896058.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


近年来,智慧检务已成大势所趋,《“十三五”时代科技强检规划纲要》确立了检察机关“感、传、知、用、管”五维一体的智慧检务应用体系总目标,并明确“逐步搭建大数据支撑环境,逐步开展大数据应用,为’智慧检务‘奠定基础的检察大数据建设任务,营造大数据应用良好生态,提升司法办公质量。

为解决公益诉讼线索发现来源渠道单一、线索转化效率低的难题,数澜科技与温州市人民检察院合作,把信息技术深度融入检察改革、司法办案、检务公开等多个层面,引入文本AI处理引擎,融合各平台线索数据,最终研发公益诉讼线索智能研判预警系统。此系统通过集成线索数据库、预警地图、统计分析数据的功能设置,将海量碎片化且无序排列的信息变成有用、有序的数据,实时掌握线索分布动态,实现了对公益诉讼线索挖掘、聚类、处置、立案的智能识别与处置跟踪,保障了公益诉讼线索的发现率和实时性,提高了办案部门工作效率,有效满足了相关群众的公益诉讼诉求,形成了一套完善的公益诉讼业务处置机制,推动社会的公平正义和法治建设,对于社会公益具有广泛的推广意义。

公益诉讼线索智能研判预警系统中的公益诉讼线索的快速识别、自动分流、评估研判、集中展示、智能预警等智能化应用,使得原先需要3名干警花费两个月时间从几万条热线举报和行政执法信息中筛选出有价值的 50 多条初步线索的工作缩短为十几秒,实现质的飞跃。据悉,此系统的应用减少80%的人工分类工作量,有效线索获取效率提升95%以上。

此案例已获得2020年浙江省智慧检察创新应用设计大赛中获评“十佳设计方案”、2021年法治日报社“智慧司法创新产品”等6项荣誉,并于2021年获中国信息通信研究院、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)评选的行业大数据优秀应用案例星河奖。

时间周期:

开始时间:2018年04月02日

截止时间:至今

服务周期:服务中

应用场景


在温州检察院内部业务流程及场景中的应用场景为数澜数栖平台结合深度学习AI处理能力(NLP及实体识别等技术)对各类线索源、裁决文书数据进行结构化处理,提取关键特征统一构建检务数据资产体系,挖掘多源线索,建立检察院“用数据分析、用数据执法”的机制,为执法监督构建“一个数据能力中心、多个业务数据应用”的“1+N”检务能力中心建设模式,实现检务数据进行标准化开发、统一化管理、深度整合、共享及场景化的应用,全面实现智能辅助办案,提升智慧案件管理水平,满足了相关群众的公益诉讼诉求,帮助维护公共利益,促进社会的良性发展。

该技术方案对整个公检法系统中的应用规模:除公益诉讼线索智能研判预警系统项目外,深度学习AI处理能力(NLP及实体识别等技术)已应用到温州检察院“在线监察监督系统”、“虚假诉讼违法监督系统”、“行政执法监督系统”以及瑞安检察院“刑事案件精准化办理智能辅助系统”中。

面临挑战


温州市人民检察院之前的应用系统的设计以业务流程为基础,应用目标主要为提高工作效率、积累工作数据等,关注信息化应用,满足特定业务流程的合理性和顺畅性,以业务流程的数据为分析基础,最终反哺业务,辅助分析。

公益诉讼制度是中国经济和社会发展的结果,随着司法体制改革对检察院的角色定位有了新的要求,检察机关需要行使公益诉讼的检察权和监督权。当前,面向公益诉讼领域,行使公益诉讼的检察权和监督权还处于探索阶段,检察机关普遍存在跑线索、要线索、等线索的被动局面,具体存在的问题表现为如下几个方面:

1、数据存在孤岛化:各业务系统加工出的数据,仅存于当前业务系统中,无法被其他业务场景所使用,成为数据孤岛。

2、数据血缘难追溯:数据加工的过程无法感知,想知道数据在哪一步发生了什么变化,无从下手。

3、应用效果感知差:业务系统的使用效果不容易进行评估,哪些数据使用频率高,哪些数据需要重点关注,无法感知。

4、公益诉讼线索收集困难:大多数检察机关处于被动接受公益诉讼线索的状态,普遍获取线索渠道比较狭窄,限于控申举报、办案过程中发现等渠道。公益诉讼类型案件,多是由民众发现污染企业并进行呼吁,造成大流量的舆论关注后才会有相关团体或部门来解决问题,难以保障公益诉讼线索的发现率和实时性。

5、公益诉讼线索分析困难:针对同一线索、事件在信访局热线当中会有多方投诉、多个用户产生的表述,承办人很难将相似的内容聚合分析。而且面对海量数据,依靠人工较难分析民众针对某一线索事件的走势。

6、公益诉讼办案过程繁琐:从检察官业务办理方面,存在着线索挖掘难,线索分流慢,办案效率低等问题,难以有效满足相关群众的公益诉讼诉求。

7、检察机关人员人力不足:当前检察机关人员少,工作任务重,目前民行部门检力资源少,日常精力都花在传统案件办理上。无法过多投入精力收集、分析线索。公益诉讼类型案件涉及跨领域知识内容(环境、食药),办理案件学习成本较高。承办人还需要面对取证、检测、鉴定等一系列问题。

因此迫切需要应用大数据和智能辅助工具来改变案件办理模式,实现自动化线索发现、流转、处置、预警闭环,进一步提升检务工作的科学、法治、高效。

技术开发过程


一、总体建设思路

1、建设目标

构建温州检察院公益诉讼智能研判系统,为基层院/市本级提供线索研判服务,为省院和市院提供跟踪、监管线索研判效果的服务,帮助检察院提升公益诉讼立案和行政执法监督立案效率,两类用户的业务目标包括:

① 基层院/市本级:提供线索研判服务,提升公益诉讼立案效率。

② 省院/市院:提供线索处理跟踪,提升监管线索研判效果的工作效率。

2、建设思路

fb27518b3b03b98d3073b253744b5790.png
总体建设思路

温州检察院公益诉讼智能研判系统,采用语义分析和机器学习等大数据技术,对12345政务服务热线投诉信息进行结构化处理,将原有的无使用价值的非结构化投诉数据转化为结构化、标准的、可供业务人员使用的线索信息。针对涉案领域、监管部门、违法事实(时间、地点、事件)、处置结果等关键文本进行提取,将相似的投诉信息归类为五大领域的线索,实现线索信息从采集到分析、归类、推送的快捷处理,减轻人工筛选公益诉讼线索的工作量。

二、项目解决方案

9afd8a187f590abfcac6720e647f7375.png

温州检院公益诉讼线索研判系统具体解决方案如下:

1、投诉线索汇聚

基于平台的数据交换能力,汇聚12345政务服务热线及行政执法处罚系统数据,实现数据互联互通,打破原有数据孤岛。

2、投诉信息关键特征值提取

利用【深度学习命名实体识别】对汇聚的政务服务热线数据中投诉主体、行政管辖、违法事实等关键特征,实现线索解构处理,构建公益诉讼数据资产体系,为后续线索研判提供有效的数据支撑。

3、线索智能归类

基于提取的关键特征值,利用【线索智能归类模型】剔除与公益诉讼无关及重复的线索,实现线索分类。按照知识库中指定的五大领域(生态环境保护、食品药品安全、国有资产保护、国有土地出让权、英烈保护),智能识别归类出有效的线索,减少人工分类的工作量及错误率。

4、线索智能关联聚焦

采用文本匹配算法,系统对全量的线索自动对比碰撞,将投诉热线信息与行政处罚系统相似线索自动关联计算,实现线索智能串联,为线索处理提供辅助决策。

5、智能分流推送

通过【线索智能分流推送规则】按照有效线索所属管辖区域,自动分流推送至被投诉对象对应的基层检察院,并且针对有效线索涉及多管辖区域的情况,支持通过人工分流的方式实现线索分流至基层检察院。

6、数据建设内容

本期数据建设数源主要来源于省信访局12345政务服务热线系统投诉数据以及苍南院-行政处罚平台数据,涉及到原始表有4张(12345信访原始数据,行政处罚原始数据,地区维表,违法事实分类维表),每天处理任务数10余项。

三、具体技术实现

045308d29d14e2fb1be8d8d7db3da892.png
公益诉讼线索研判技术处理流程图

1、算法设计

算法中主要实现了线索分类计算、地名识别、线索与线索以及线索与案件关联的处理。

(1)分类算法设计

a.基于关键词进行文本分类

统计并人工整理每个类别的关键词,且部分词能有效的进行组合,确保分类的准确性,如“土地”和“倒卖”等。

b.基于深度学习textCnn进行文本分类

TextCNN是利用卷积神经网络对文本进行分类的算法,卷积具有局部特征提取的功能,所以可用CNN来提取句子中类似n-gram的关键信息。与图像等处理方法不同的是图像是二维数据,经过词向量表达的文本为一维数据,因此在TextCNN卷积用的是一维卷积。

(2)地名识别设计

a.建立三级地名库,不包含温州市这个等级

b.提取句子中包含的最长的地名,防止出现截断式地名

c.抽取地名流程如下:

b54f7972abb06f88b80067fb0927a004.png

(3)关联算法设计

a.12345内部关联算法实现

● 基于规则截取出线索中的事件信息;

● 基于词性和去停用词处理去除事件信息中的冗余信息,形成词向量;

● 基于相同地名和分类(即领域)进行第一次线索聚类;

● 在已经分类的信息中基于文本相似度计算进行线索的二次聚类,并得出相关线索。

b.12345和行政执法之间关联计算方法实现

● 基于规则截取出线索中的事件信息;

● 基于词性和去停用词处理去除事件信息中的冗余信息,形成词向量;

● 由于每一条12345的数据都要与行政执法的数据进行计算,将条件限制在相同的分类上,以此减少计算量;对相同分类以及部分关键词(提取的领域关键词)相同的信息进行相似度计算,设置阈值,得出与12345相关的一些行政执法案件。

2、部署架构设计

从部署的计划上,并考虑到尽量节省温州市政务云资源,我们将前后端应用服务器部署在同一机器上,并采用一台机器用于算法、数据计算、存储,第三台机器用于部署应用测试环境,同时业务数据库采用云数据库统一管理。

577707f4f5114f9f399a7e4b0bf572e1.png

1cfb5c06bcd7708ea9bcc7c6b33a0ea9.png

四、解决方案亮点

e6aa315a402159e58c4042f3f82fc490.png

该平台通过建立“民生热线+ 执法数据+检察监督”三位一体公益诉讼线索发现机制,加强数据共享、 信息采集、筛选流转、评估研判、分类预警,从而解决公益诉讼线索发现难、转化难、管理难的问题。

实现数据共享、信息采集、筛选流转、评估研判、分类预警能力的提升,从而解决公益诉讼线索发现难、转化难、管理难的问题;通过集成线索数据库、预警地图、统计分析数据的功能设置,实时掌握线索分布动态,实现公益诉讼线索的快速识别、自动分流、评估研判、集中展示、智能预警等智能化应用,进一步解决线索转化和管理问题;通过汇集公益诉讼数据,统一构建检察院数据资产体系,对诉讼来源、过程、结果进行深度挖掘、分析,建立“用数据分析、用数据执法”的机制,为诉讼执法监督提供支撑、为法治政府建设提供服务。

具体亮点如下:

1、公益诉讼线索处理全链路整合

将线索获取、有限线索筛选、线索关联、线索智能分流、线索处理反馈等办案过程全链路打通。

2、线索数据自动同步

基于数栖平台基础支撑能力,自动化抽取12345热线线索与行政执法线索、替代人工操作。

3、有效线索智能筛选

基于深度学习的文本分类算法,对海量热线线索自动识别、筛选,获取公益诉讼相关线索。

4、线索处理反馈

采用自动化的线索处理进度跟踪流程,系统实时跟进自动分流线索、待分流线索、接收线索、立案线索、不立案线索。

5、线索关联辅助

系统对全量的线索自动对比碰撞,将相似投诉信息自动增量关联为线索,分析线索的投诉次数、人数、持续投诉时间以及发展态度,协助办案人员获知线索办理优先级。

6、统计分析,洞察有效线索

按涉案领域、监管部门、违法事实等多维度深度解析,同时提供领先可视化展示方式实现全局洞察。

该技术方案对整个公检法系统中的应用规模:除公益诉讼线索智能研判预警系统项目外,深度学习AI处理能力(NLP及实体识别等技术)已应用到温州检察院“在线监察监督系统”、“虚假诉讼违法监督系统”、“行政执法监督系统”以及瑞安检察院“刑事案件精准化办理智能辅助系统”中。

应用效果/社会价值


一、应用效果

在温州检察院内部业务流程及场景中的应用场景:数澜数栖平台结合深度学习AI处理能力(NLP及实体识别等技术)对各类线索源、裁决文书数据进行结构化处理,提取关键特征统一构建检务数据资产体系,挖掘多源线索,建立检察院“用数据分析、用数据执法”的机制,为执法监督构建“一个数据能力中心、多个业务数据应用”的“1+N”检务能力中心建设模式,实现检务数据进行标准化开发、统一化管理、深度整合、共享及场景化的应用,全面实现智能辅助办案,提升智慧案件管理水平。

自公益诉讼线索智能研判预警系统运行以来,截止当前已收集23万余条的信息,评估并自动分流有效线索6万余条,紧急预警线索5000余条。

系统未上线以前,温州地区公益诉讼立案数92件,发出行政诉前检察建议65件,提起刑附民公益诉讼2件。2018年7月系统上线后,当年的7月-12月共立案数880件,发出行政诉前检察建议773件,提起刑附民公益诉讼18件,整体检察建议数和公益诉讼立案数相较都实现了质的飞跃。整体减少80%的人工分类工作量,有效线索效率提升95%以上。

同时,原先3名干警需花费两个月时间,从几万条热线举报信息和行政执法信息中筛选出有价值的50多条初步线索,如今同样的工作只需耗时十几秒。

d003b1d2528491b5ade2d8506e0fe953.png

公益诉讼线索研判系统上线之后,获得浙江全省检察机关十佳创新应用并推广至浙江全省,温检项目组成员同时获得18年度集体二等功的优秀荣誉。

二、社会价值

“公益诉讼线索智能研判预警系统项目”,旨在解决公益诉讼线索发现来源渠道单一、线索转化效率低的难题,温州市院携手大数据合作伙伴数澜科技,引入文本AI处理引擎,融合各平台线索数据,研发公益诉讼线索智能研判预警系统,将海量碎片化且无序排列的信息变成有用、有序的数据,解决人工信息处理模式分流筛选速度慢、有效线索提取效率低的弊端,也解决了公益诉讼线索发现难、转化难、管理难的问题,极大地提升了办案人员的办案效率和办案能力。

数澜利用数栖平台基于场景化应用建设,形成具有检务特色的数据资产体系,形成检察行业数据标准、数据安全体系、数据目录以及标签管理体系,实现数据全生命周期的资产化管理,安全的资源隔离、权限控制审计日志等,提高数据安全性,加强技术安全与数据隐私保护;建立数据共享机制,打破数据孤岛,实现数据高效共享。助力温州市人民检察院通过法律手段促进社会公平正义,保护弱势群体的权益,改善社会环境。

该技术方案对整个公检法系统中的应用规模:除公益诉讼线索智能研判预警系统项目外,深度学习AI处理能力(NLP及实体识别等技术)已应用到温州检察院“在线监察监督系统”、“虚假诉讼违法监督系统”、“行政执法监督系统”以及瑞安检察院“刑事案件精准化办理智能辅助系统”中。

关于企业


·数澜科技

数澜科技成立于2016年6月20日,是一家专业的数据应用基础设施供应商,秉持“让数据用起来”的使命,以一站式数据中台搭建基础设施“数栖”产品为核心,数据中台解决方案、数据可视化服务、数据智能解决方案等产品矩阵,为政府、企业提供咨询、技术支持、实施落地等一站式数据资产化与应用服务,助力客户商业智能创新。目前,数澜科技旗下产品已广泛应用于军工、政府、地产、金融、制造、教育等领域。点击文末“阅读原文”链接,还可了解更多“数澜科技”信息。

·温州市人民检察署

温州市人民检察署于1950年12月成立,1981年11月,原市院并入温州分院,成立现在的温州市人民检察院。温州市人民检察院下辖鹿城区、龙湾区、瓯海区、瑞安市、乐清市、苍南县、永嘉县、平阳县、洞头县、文成县、泰顺县等基层院。


以上由数澜科技投递申报的项目案例,最终将会角逐由数据猿与上海大数据联盟联合推出的 #榜样的力量# 《2023中国数据智能产业最具社会责任感企业》榜单/奖项

该榜单奖项最终将于11月14日以下活动中进行榜单的首发与奖项的颁发,欢迎报名莅临现场:

6730345da647903b772a03c42f46b43d.jpeg

74696638b8814f0a2548b12edc3a3327.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1179044.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】七、基础IO

预备知识 文件 属性(本质上也是数据)内容; 文件的所有操作大致有两种,对内容的操作,和对属性的操作; 文件在磁盘中放置,磁盘是硬件,只有操作系统可以真正的访问磁盘;C\C…

【Matplotlib】plt.plot() X轴横坐标展示完整整数坐标

比如说,我的数据应该是 x轴从2到21的20个整数 y轴对应值 但是直接plot的话x轴显示居然有小数点什么鬼 可以这样改

四维轻云如何实现地理空间数据在线管理、编辑及分享?

四维轻云是一款轻量化的地理空间数据网页管理平台,支持多种地理空间数据的在线管理、编辑及分享。现阶段,平台具有项目管理、数据上传、场景搭建、发布分享、团队成员、素材库等功能模块,支持项目团队成员在线协作管理,能够在线管…

Python---capitalize() 方法---把字符串的首字母大写,其他字符全部小写

capitalize 英 /ˈkpɪtəlaɪz/ v. 用大写字母书写(或印刷),把……首字母大写;为(开办或发展企业)提供资金;(将资产或股票)变现,使资本化;&…

win11下使用VMmare设置CentOS7里面的静态IP

1,win11上的VMware 8 设置 2,选择VMmare上的虚拟网络编辑进行设置 #3,接下来进入虚拟机设置(就是进入CentOS7 打开终端 右键 Open Terminal ) # 切换root su root #ksana #编辑网络配置文件 vi /etc/sysconfig/networ…

visual studio Python 配置QGIS(qgis)教程

visual studio Python 配置QGIS(qgis)教程 这个教程全网独一份啊,博主是自己摸索出来的。 visual studio Python 配置QGIS(qgis)环境一共分为两部: 第一步安装QGIS: 下载链接如下 https://www…

Java快速排序算法、三路快排(Java算法和数据结构总结笔记)[7/20]

一、什么是快速排序算法 快速排序的基本思想是选择一个基准元素(通常选择最后一个元素)将数组分割为两部分,一部分小于基准元素,一部分大于基准元素。 然后递归地对两部分进行排序,直到整个数组有序。这个过程通过 par…

数据的备份和恢复

数据的备份和恢复 备份:完全备份 增量备份 完全备份:将整个数据库完整的进行备份 增量备份:在完全备份的基础之上,对后续新增的内容进行备份 备份的需求 1、在生产环境中,数据的安全至关重要、任何数据的丢失都可…

【10套模拟】【2】

关键字: 哈希函数解决问题、进栈、无向图边与度、双向链表插入新结点、折半查找判定树ASL、孩子兄弟表示法、树变二叉、快排partiction划分

十大排序算法C++实现

分类 复杂度 排序稳定性定义: 假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,A1A2,且A1在A2之前,而在排序后的序…

Django初窥门径-oauth登录认证

引言 在现代Web应用程序中,用户身份验证和授权是至关重要的组成部分。Django,一个流行的Python Web框架,为用户身份验证提供了内置支持。本文将探讨如何创建和注册Django应用,自定义身份验证服务,配置AUTHENTICATION_…

网络数据包传感器简化流量监控

数据包捕获基于数据包镜像的概念,可用于深度数据包检查、测量应用程序的响应时间以及监视服务器、网络和用户行为,该技术还可用于对需要特定信息的某些区域进行广泛分析,尽管它有效,但并非在所有情况下都是必要的。要分析和管理流…

【MogDB/openGauss误删未归档的xlog日志如何解决】

在使用MogDB/openGauss数据库的过程中,有时候大量业务,或者导数据会导致pg_xlog下的日志数量持续增长,此时如果xlog的产生频率太快,而来不及自动清理,极有可能造成pg_xlog目录的打满。如果对数据库的xlog不太了解的时候…

HTTP 协议详解-上(Fiddler 抓包演示)

文章目录 HTTP 协议HTTP 协议的工作过程HTTP 请求 (Request)认识URL关于 URL encode认识 "方法" (method)GET 方法POST 方法其他方法请求 "报头" (header)请求 "正文" (body) HTTP 响应详解状态码响应 "报头" (header) HTTP 协议 HTT…

仪表盘 gauge

option {tooltip: {formatter: {a} <br/>{b} : {c}%},series: [{name: Pressure,type: gauge,startAngle: 225, // 起始角度&#xff0c;同极坐标endAngle: -45, // 终止角度&#xff0c;同极坐标// axisLine: {// //坐标轴轴线// show: false// },// splitLine: {//…

RT-Thread 10. 使用keil4编译GD32F450

1. 修改keil路径 2.增加MCU型号宏定义 3. 在ENV界面输入 scons -c scons --targetmdk44. 编译 scons --verbose提示错误 Warning: L6310W: Unable to find ARM libraries. Error: L6411E: No compatible library exists with a definition of startup symbol __main. Finish…

Pytorch 里面torch.no_grad 和model.eval(), model.train() 的作用

torch.no_grad: 影响模型的自微分器&#xff0c;使得其停止工作&#xff1b;这样的话&#xff0c;数据计算的数据就会变快&#xff0c;内存占用也会变小&#xff0c;因为没有了反向梯度计算&#xff0c;当然&#xff0c;我哦们也无法做反向传播。 model.eval() 和model.train()…

C/C++数的输入输出 2021年6月电子学会青少年软件编程(C/C++)等级考试一级真题答案解析

目录 C/C数的输入输出 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序编写 四、程序说明 五、运行结果 六、考点分析 C/C数的输入输出 2021年6月 C/C编程等级考试一级编程题 一、题目要求 1、编程实现 输入一个整数和双精度浮点数&#xff0c;先将浮…

Sui发布RPC2.0 Beta,拥抱GraphQL并计划弃用JSON-RPC

为了解决现有RPC存在的许多已知问题&#xff0c;Sui正在准备推出一个基于GraphQL的新RPC服务&#xff0c;名为Sui RPC 2.0。GraphQL是一种开源数据查询和操作语言&#xff0c;旨在简化需要复杂数据查询的API和服务。 用户目前可以访问Sui主网和测试网网络的Beta版本的只读快照…

如何以电商“API”接口的形式帮助电商商家解决货源及运营难题?

如何帮助电商商家解决货源及运营难题&#xff1f;API 接口创建供应链的突出优势应该就是“API”接口的开发与应用了&#xff0c;通过API技术接口&#xff0c;来帮助商家快速实现货源采购及上架等需要。那么具体来说&#xff0c;创胜货源供应链是如何以“API”的形式来帮助电商商…