今年6月份的时候,笔者发过一篇文章《DIKW模型在档案信息资源开发中的应用》,简要阐述了知识管理领域非常著名的DIKW模型,即从数据(Data)→信息(Information)→知识(Knowledge)→智慧(Wisdom)金字塔模型,并给出了档案信息资源开发中的三个应用场景:资源入库、档案编研和智能推荐。但有读者反馈说不解渴,希望笔者能够提供具体的应用案例。今天笔者就结合10年前在华东某检察机关的实践给出档案知识管理的案例供读者参考。
检察行业信息化管理
从检察行业的实际情况来看,检察院日常产生的数据既包括业务应用、队伍建设、办公应用和检务保障等应用系统产生的结构化数据;也包括案件文书、庭审录像、审讯同录、档案数字化产生的非结构化数据;还包括法律文书库、多媒体课件、审讯案例库、调研文章等其他信息资源。如果是一个地市级单位,需要作为档案长期保存的数据量每年大致在几十TB级别;如果算上累积到现在的历史数据,就可以达到上百TB;如果再算上下属区县院的数据量,全市检察机关的数据规模甚至可以达到PB级别,妥妥的大数据。
该单位档案信息化建设工作已经取得初步成绩,经过几年的建设和应用,初步完成了从档案实体管理到档案信息管理的过渡。期间,市院陆续开发了诉讼档案著录系统、庭审多媒体档案系统、检察综合档案管理系统以及全市检察机关档案查询平台等档案管理软件。从档案管理的环节上看,覆盖了收集、整理、保管、鉴定、检索、编研、利用、统计等八大环节;从档案类型上看,覆盖了诉讼档案、文书档案、科技档案、会计档案、声像档案、文档资料等各种类型;从系统应用模式上看,既有全市集中式应用的系统,比如全市检察机关档案查询平台,也有市院统一建设,然后统一下发至各区县院的系统,比如检察综合档案管理系统。从资源建设上来看,一方面,全市检察机关历史档案的数字化加工工作在持续开展之中,截至到2018年年底已完成600多万条的目录著录和3000多万页的扫描加工任务;另一方面,电子文件单套制归档和管理试点工作也在如火如荼的推进之中,越来越多的电子文件直接归档成为电子档案。
时至今日,全市检察机关已经实现了全面应用现代信息技术对档案信息资源进行处置、管理并提供服务,完全抛弃了过去手工方式对档案实体进行管理的模式,因此,全市检察机关的档案管理工作已经基本实现信息化管理。
“档案资源库”→“档案知识库”
但问题是现在早已进入大数据时代,仅仅实现检察档案资源的信息化管理已经不能满足要求,档案信息化工作需要与时俱进,从档案信息管理向档案知识管理过渡。检察机关档案工作者需要站在单位领导的高度思考这样一个问题:如何将“档案资源库”变成“档案知识库”
所谓档案知识管理就是将知识管理的理论和方法运用于档案的各项管理活动中,在原有档案实体管理和信息管理的基础上,注重对档案系统内外知识点的构筑和知识流的管理,建立以档案利用者满意为中心的档案知识服务体系。在档案知识管理阶段,传统档案工作内容将发生重大变化。如在档案收集工作中,强调“新来源观”,注重对文件的前端控制,尽可能全地收集文件的各方面信息,并对文件实施全过程管理;在档案编研工作中,将实施“用户驱动”的编研模式,即根据最终用户的需求有针对性的开展专题编研工作,而不是按部就班的开展工作;在档案利用服务工作中,档案人员将从档案保管员变为知识提供者,档案利用服务工作的重点从实体调阅、信息检索转移到知识供给上。
档案管理从实体管理发展到信息管理再到知识管理,是档案信息化发展的必然趋势,是时代赋予档案部门的责任,也是档案部门寻求自我突破和发展的必然选择。而大数据时代的来临,大大加快了这一进程,使之成为档案信息化的必由之路,这主要体现在以下几个方面:
1.大数据时代,数据的价值被大大稀释,传统的信息管理手段已经难以从海量数据中获取有价值的信息,必须采用新的以知识为中心的信息组织方式;
2.大数据时代,数据处理和信息服务的实时性要求更加迫切,被动查询逐渐被主动推送的服务模式代替,系统需要从数据矿山中找到蕴藏的知识金块提供给利用者,这就使知识发现成为新的、主流的档案利用方式;
3.大数据时代,结构化、非结构化,各种类型的数据混杂,数据中“显性知识”的占比越来越低,大量的知识都是隐藏在数据背后的“隐性知识”,传统的信息管理手段无法实现对“隐性知识”的管理,需要引入新的知识管理手段,将“隐性知识”转化为“显性知识”。
检察档案知识管理
为了应对大数据时代带来的巨大冲击,检察档案部门必须在现有信息化建设成果基础上规划设计下一阶段的信息化建设任务,并按照档案知识管理的思路和要求进行规划。
大数据时代检察档案知识管理框架设计如下图所示。
自底向上档案知识管理系统规划建设的主要内容包括:
1、数据中心
即知识管理系统的基础数据资源池,汇集了检察机关产生的各类数据,包括结构化、半结构化和非结构化数据;
2、支撑平台和服务
是知识管理系统的应用支撑平台和基础服务,很多支撑平台和服务具有通用性,可以和检察机关的整体信息化建设统一规划;
3、档案信息管理
是对现有档案信息化建设成果的无缝整合,也是档案知识管理系统的基础功能;
4、知识管理
从知识的视角出发对档案信息形成的知识点进行全生命周期的管理;
5、知识库管理
既包括各个知识库的建立,也包括针对知识库的管理功能,比如知识地图、知识分类、知识搜索等;
6、知识工具
积累知识点、建立知识库所必备的各类工具,比如全文检索引擎、知识挖掘工具、商务智能引擎等;
7、知识共享门户
知识管理系统的最终展现,体现出主动信息服务和智能信息服务的理念,包括公共门户和个人门户两部分,前者主要用于公共知识的交流与共享,或者则是针对用户个人习惯的知识订阅与推送。
在整个框架中,资源池(数据中心)是最重要的,也是检察机关档案信息化建设中最宝贵的财富,这需要工作人员在业务工作开展过程中逐步积累。而知识管理体系的构建一般都需要引进专业公司的专业顾问和专业软件,并在此基础上结合本单位的实际需求进行定制开发而成。比如现在流行的文档、档案、知识一体化管理,就可以实现从档案信息管理到档案知识管理的跨越,一步到位。
上图蓝框所示中的DMS即为文档管理系统(Document Management System),ERMS即为电子档案管理系统(Electronic Records Management System),KMS即为知识管理系统(Knowledge Management System)。
而知识管理更是和大数据、人工智能紧密相关的技术,在一定程度上来说是属于“数据智能(BD+AI)”领域的应用。不管是统一搜索、智能推荐、知识图谱还是数据挖掘、决策分析,都离不开大数据和人工智能技术的支撑。
由于建设内容的敏感性和保密性要求,笔者只能给出框架设计,而无法将具体系统功能和取得的应用效果在文章中分享,望读者见谅,有兴趣可以线下交流。
数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!