AI赋能档案开放审核:实战

news2024/11/25 15:42:21

关注我们 - 数字罗塞塔计划  - 

为进一步推进档案开放审核工作提质增效,结合近几年的业务探索、研究及项目实践,形成了一套较为成熟、高效的AI辅助档案开放审核解决方案,即以“AI+人工”的人机协同模式引领档案开放审机制创新,在档案开放审核服务过程中,从“定制本地化审核模型、审核数据前处理、SM筛查、AI辅助审核、专业人工复核等九个环节全方位构建AI辅助档案开放审核框架,有效实现档案开放审核的智能化治理和管控,从而推动档案开放审核工作向高质量发展。

( 一 )

AI辅助档案开放审核九步工作法

九步工作法如下图所示:

第一步 制定审核工作计划

根据到期档案审核任务的提醒,结合档案开放审核工作的总体要求,由档案开放审核小组组织开展审核工作,明确审核工作内容、周期,针对审核数据的所属年代、数字化(数据化)进展情况以及现行的审核办法、会审要求等事项进行研究讨论,制定审核工作计划,明确审核工作目标和任务。

第二步 定制本地化审核模型

运用AI辅助档案开放审核管理系统(以下简称“审核系统”),结合档案开放审核办法,细化审核规则调整,训练本地数据,定制适应本地化的算法模型。经过“AI赋能”不仅能够扩大有效供给,提升供给能力,而且能够促进供给侧与需求侧的高效耦合和精准匹配,进一步优化审核能力。

第三步 数据交接

结合审核系统部署情况,可实现在线或离线交接待审核数据。其中在线交接即同在局域网环境下,打通审核系统与馆藏系统的数据接口,在线接收馆藏系统推送的数据包(条目+全文)。全文导入格式支持:PDF、JPG、TIFF等,条目字段值支持选择性获取,如档号、责任者、年度、文件编号、题名等。

第四步 SM筛查

结合档案管理现状,审核过程中可能接触未解密档案数据,为规范作业,需根据工作需要原则、最小化原则设定人员知悉范围。由具有知悉权的人员进行涉密筛查,排除密件后,交由其他工作人员处理,同时落实数据安全、操作安全等措施,确保档案开放审核合理、规范。

第五步 数据质量处理

因部分档案数字化年代较早,档案整理、数字化加工等的数据质量问题直接影响审核判定,因此审核前进行数据质量处理必不可少。具体措施主要包括以下几个方面:一是数据质量检测。基于国家相关标准规范,借助档案数据质量检测工具,自动生成检测报告;二是数据清洗,对于影响开放审核及利用的问题数据,如条目与全文数量不匹配,无全文等问题进行修正;三是数据化处理,结合审核数据数字化成果特征,运用OCR识别专用技术,针对待审核数据进行数据化处理。

第六步 AI辅助审核

构建开放以及延期开放关键词规则库,运用AI算法模型实现智能分库,通过自动或人工分配审核任务,由AI辅助审核,形成初审意见,即形成开放或延期开放审核意见。

第七步 专业人员审核

在AI辅助审核后设置人工审核子流程,包括专业人工复审、移交单位会审、档案馆终审等步骤。由专业人员对AI辅助审核意见进行复审,同时进行数据分析,从而保障审核准确率。

第八步 模型训练

对终审数据按分类编制数据集,进行AI算法模型训练,将其中大部分数据输入模型中进行训练,并对训练好的模型通过剩余的数据进行准确率测试,预测准确率达到预期值以上时即认为模型训练成功,否则需要调整模型算法直至达到预期值。模型训练成果反哺审核系统,从而形成AI辅助开放审核的闭环管理。

第九步 审核成果输出

通过“人机协同”完成审核任务,自动形成开放件、延期开放件两大数据集,同时输出审核成果。一是形成报表,审核系统按全宗、年度等要素自动输出《各全宗各年度拟审核意见统计表》、《拟开放目录汇总表》、《档案开放审核单》等统计类报表;二是编制报告,专业人员根据审核数据分析情况,编撰内容全面、数据详实的《档案开放审核服务工作报告》;三是向社会公布,结合档案馆向社会公布要求,对已审核数据设置到期提醒,满25年自动启动对外公布。

( 二 )

AI辅助档案开放审核案例分析

1、传统审核模式工期估算

某档案馆十四五期间待审核档案(文书档案)共计50万件,馆内开放审核小组工作人员共计3人。按传统审核模式(即以人工为主,逐卷逐件逐页进行审核)完成审核任务,预估830个工作日。

传统模式工作情况表

※ 说明:移交单位会审、档案馆终审等工作流程不含其内。

2、采用AI技术实施成效

鉴于该档案馆审核人员少、工作任务重等现状,馆方决定采购第三方服务,通过“AI+人工”的人机协同模式进行开放审核。按照上述“九步工作法”,运用AI技术进行智能辅助审核,同时由专业人员进行验证后交由档案馆进行复审(或移交单位会审)。

“AI+人工”模式工作情况表

※ 说明:移交单位会审、档案馆终审等工作流程不含其内。

3、案例分析

上述实例,采用“AI+人工”审核模式开展档案开放审核,借助AI的能力,审核工作战线缩短,效率显著提升,人力投入减少。同时,通过专业人员的审核加持,避免了AI审核的误判情况,大幅度提升审核质量,杜绝档案开放的安全隐患。        

全方位的人员结构:

规范化、标准化项目现场:

(模拟项目现场)

(三)

提升AI辅助档案开放审核能力的几点思考

尽管近年来AI技术突飞猛进,但AI在档案开放审核领域中其主要作用依然是辅助。如何实现AI的有效应用,提高AI辅助的准确性、有效性,是当下档案开放审核工作中热度最高的话题之一。结合AI技术在档案开放审核工作中的应用实践,现阶段在AI热潮下,如何做到冷思考与新出发?

一是持续夯实基础

丰富的档案资源是“走向开放”的前提,进一步做优做实做强档案资源基础。一方面要坚持以“内容为王”走向开放,做到“能开尽开”,让档案在开放中走进群众、走进社会,更好服务经济社会发展;另一方面,也要加强归档材料收集的齐全、完整,同时保障档案从数字化到数据化的质量。

二是筑牢安全防线

坚持技术发展和安全可控的双轮驱动,强调在确保信息安全的前提下开展AI技术的应用,构建安全可信环境下的AI赋能框架。

三是加强深度学习

以数据为中心,以深层次的网络堆叠为架构,提供数量量大、内容丰富、结构多样的档案资源,强化训练模型的神经网络泛化能力,进一步提升AI审核能力。

四是育强人才队伍

AI赋能之“根”依然在于人的智慧,需要进一步扩面培养档案开放审核专业技术人员,加强业务学习、技术培训、保密教育,培优育强人才队伍,不断提升档案开放审核的水平和效能。

更多AI赋能档案开放审核细节及相关疑问欢迎4月13日(星期六)来 -数字罗塞塔计划- 直播间交流探讨。

关注我们 - 数字罗塞塔计划  -   

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1591298.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TyG新文章!与胸痛的高发生率正相关 | NHANES数据库周报(4.10)

NHANES挖掘培训班来啦,就在4.20-21! 郑老师团队2024年NHANES公共数据库挖掘培训班,由浅入深,零基础可学,欢迎报名! 美国国家健康和营养检查调查(NHANES)是一项旨在评估美国成人和儿童…

Python通过socket搭建一个web服务器

目录 01、源码 02、运行结果 03、小结 Socket是一种计算机网络通信的一种机制,它允许不同计算机或进程之间通过网络进行数据传输和通信。Socket可以被看作是不同计算机之间的数据传输通道,通过这个通道,计算机之间可以进行双向的数据传输。…

区块链游戏:探索未来的可能性与挑战

区块链游戏是一种将区块链技术应用于游戏领域的创新产品,它为游戏行业带来了全新的模式和可能性。本文将深入探讨区块链游戏的优点、挑战和未来趋势,帮助读者了解这一新兴领域。 一、区块链游戏的优点 1. 公平性:区块链技术保证了游戏中的物…

LeetCode-Java:303、304区域检索(前缀和)

文章目录 题目303、区域和检索(数组不可变)304、二维区域和检索(矩阵不可变) 解①303,一维前缀和②304,二维前缀和 算法前缀和一维前缀和二维前缀和 题目 303、区域和检索(数组不可变&#xff…

二叉树遍历算法和应用

二叉树是指度为 2 的树。它是一种最简单却又最重要的树,在计算机领域中有这广泛的应用。 二叉树的递归定义如下:二叉树是一棵空树,或者一棵由一个根节点和两棵互不相交的分别称为根节点的左子树和右子树所组成的非空树,左子树和右…

【数据结构】07查找

查找 1. 基本概念2. 顺序表查找2.1 顺序查找2.2 顺序查找优化-哨兵 3. 有序表查找3.1 折半查找(二分查找) 4. 分块查找(索引顺序查找)5. Hash表(散列表)5.1 散列函数的设计5.2 代码实现5.2.1 初始化Hash表5…

再谈C语言——理解指针(一)

内存和地址 内存 在讲内存和地址之前,我们想有个⽣活中的案例: 假设有⼀栋宿舍楼,把你放在楼⾥,楼上有100个房间,但是房间没有编号,你的⼀个朋友来找你玩, 如果想找到你,就得挨个房…

【C++11】异常知多少

> 作者:დ旧言~ > 座右铭:松树千年终是朽,槿花一日自为荣。 > 目标:熟练掌握C11异常 > 毒鸡汤:有些事情,总是不明白,所以我不会坚持。早安! > 专栏选自:C嘎嘎进阶 &g…

Ubuntu22.04 + ROS2 Humble的环境配置

Ubuntu22.04 ROS2 Humble的环境配置 文章目录 Ubuntu22.04 ROS2 Humble的环境配置(1) Set locale(2) Setup Sources(3)安装ROS2(4)检查是否成功安装 参考官方网站ROS2-Installation ROS2的各种版本及维护计划,可以参考ROS2-List of Distributions (1) Set locale…

gitlab、jenkins安装及使用文档二

安装 jenkins IP地址操作系统服务版本192.168.75.137Rocky9.2jenkins 2.450-1.1 jdk 11.0.22 git 2.39.3192.168.75.138Rocky9.2gitlab-ce 16.10.0 结合上文 jenkins安装 前期准备: yum install -y epel-release yum -y install net-tools vim lrzsz wget…

AIGC的崛起:定义未来内容创作的新纪元

🌟文章目录 🌟AIGC简介🌟 AIGC的相关技术与特点🌟AIGC有哪些应用场景?🌟AIGC对其他行业影响🌟面临的挑战与问题🌟AIGC未来发展 🌟AIGC十大热门网站推荐: 文心…

一键开启Scrum回顾会议的精彩时刻

其实回顾会议作为一个检视、反馈、改进环节,不仅在传统的瀑布管理模式中,还是在Scrum一类的敏捷管理流程中,都是非常重要的活动。一些团队认为它无法产生直接的价值,所以有意忽略了这个会议;一些团队在越来越多的回顾中…

【Python】面向对象(专版提升2)

面向对象 1. 概述1.1面向过程1.2 面向对象 2. 类和对象2.1 语法2.1.1 定义类2.1.2 实例化对象 2.2 实例成员2.2.1 实例变量2.2.2 实例方法2.2.3 跨类调用 3. 三大特征3.1 封装3.1.1 数据角度3.1.2 行为角度3.1.3 案例:信息管理系统3.1.3.1 需求3.1.3.2 分析3.1.3.3 设计 3.2 继…

MySQL·:执行一条查询语句期间发生了什么?

MySQL的架构分为两层,Server 层和存储引擎层 server层负责建立连接、分析和执行SQL,MySQL,MySQL大多数的核心功能模块都在在这里实现,下图上半部分都是server层做的事情,另外,所有的内置函数(如…

Springboot+Vue项目-基于Java+MySQL的房产销售系统(附源码+演示视频+LW)

大家好!我是程序猿老A,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:Java毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计 &…

JS - BOM(浏览器对象模型)

BOM 浏览器对象模型 BOM可以使我们通过JS来操作浏览器 在BOM中为我们提供了一组对象,用来完成对浏览器的操作 BOM对象 BOM(Browser Object Model)是指浏览器对象模型,它提供了与浏览器窗口进行交互的对象和方法。BOM包括一些核…

C++——StackQueue

目录 一Stack 1介绍 2接口 3模拟实现 4栈的oj题 二Queue 1介绍 2接口 3模拟实现 三容器适配器 1再谈栈和队列 四优先级队列 1接口 ​编辑 2仿函数 五dequeue的简单介绍 一Stack 1介绍 先来看看库中对栈的介绍: 1. stack是一种容器适配器&#x…

scaling laws for neural language models

关于scaling law 的正确认识 - 知乎最近scaling law 成了最大的热词。一般的理解就是,想干大模型,清洗干净数据,然后把数据tokens量堆上来,然后搭建一个海量H100的集群,干就完了。训练模型不需要啥技巧,模型…

解决 App 自动化测试的常见痛点!

App 自动化测试中有些常见痛点问题,如果框架不能很好的处理,就可能出现元素定位超时找不到的情况,自动化也就被打断终止了。很容易打消做自动化的热情,导致从入门到放弃。比如下面的两个问题: 一是 App 启动加载时间较…

Vue 移动端(H5)项目怎么实现页面缓存(即列表页面进入详情返回后列表页面缓存且还原页面滚动条位置)keep-alive缓存及清除keep-alive缓存

一、需求 产品要求:Vue移动端项目进入列表页,列表页需要刷新,而从详情页返回列表页,列表页则需要缓存并且还原页面滚动条位置 二、实现思路 1、使用Vue中的keep-alive组件,keep-alive提供了路由缓存功能 2、因为我项…