DAMA数据管理知识体系(第9章 文件和内容管理)

news2024/10/8 22:33:26
  • 课本内容
    • 9.1 引言
      • 概要
        • 文件和内容管理是指针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理[1]。它的重点在于保持文件和其他非结构化或半结构化信息的完整性,并使这些信息能够被访问。
      • 业务驱动因素
        • 法规遵从性要求
          • 法律法规要求组织保留某些活动的档案
        • 诉讼响应能力
        • 电子取证请求能力
          • 电子取证是查找可能作为法律诉讼证据的电子档案的过程
        • 业务连续性要求
          • 提高效率是改进文件管理的驱动力。文件管理方面的技术进步,有助于组织简化流程、管理工作流、消除重复性的手动任务并实现协作。
      • 语境图
        • 图9-1 语境关系图:文件和内容管理
      • 目标和原则
        • 目标
          • 1)确保能够高速有效地采集和使用非结构化的数据和信息。2)确保结构化和非结构化数据之间的整合能力。3)遵守法律义务并达到客户预期。
        • 原则
          • 1)组织中的每个人都应该在保护组织的未来方面发挥作用。每个人都必须按照既定的制度和程序来创建、使用、检索和处置档案。
          • 2)档案和内容处理方面的专家应充分参与制度和规划的制定。不同的行业和法律管辖区之间,监管实践可能会有很大的差异。
      • 档案保存指导原则
        • ARMA国际(非营利性的档案和信息管理专业协会)在2009年发布
        • 内容
          • 问责原则
          • 完整原则
          • 保护原则
          • 遵从原则
          • 可用原则
          • 保留原则
          • 处置原则
          • 透明原则
      • 基本概念
        • 内容
          • 内容管理
            • 内容管理(Content Management)包括用于组织、分类和构造信息资源的流程、方法和技术,以便以多种方式存储、发布和重复使用这些资源。
          • 内容元数据
            • 非结构化数据内容的元数据基于:
              • 格式
              • 可搜索性
              • 自我描述性
              • 既有模式
                • 是否可以采用或者适配现有的方法和模式(如在图书馆目录中)。
              • 内容主题
                • 人们可能在寻找的东西。
              • 需求
                • 需要进行彻底和详细的检索能力(如制药或核工业)。
          • 内容建模
            • 内容建模(Content Modeling)是将逻辑内容概念转换为具有关系的内容类型、属性和数据类型的过程
          • 内容分发方法
            • 内容需要模块化、结构化、可重复使用,且与设备和平台无关
            • 内容分发系统可分为三种,分别是推式、拉式和交互式。
        • 受控词表
          • 受控词表(Controlled Vocabularies)是被明确允许用于通过浏览和 搜索对内容进行索引、分类、标引、排序和检索术语的定义列表
          • 词汇表管理
            • 词汇表管理关键问题集中于用途、消费者、标准、维护 4 个方面。
          • 词汇表视图和微控制词汇表
            • 词汇表视图(Vocabulary View)是受控词表的子集,涵盖了受控词表领域内有限范围的主题。
          • 术语和选择列表
          • 术语管理
            • 关系的类型
              • 等价术语关系
              • 层次化关系
                • 它描述广义(一般)到狭义(特定)或整体-部分的关系。
              • 关联关系
                • 与受控词表中的另一个术语相关联,但这种关联不是层次化的。
          • 同义词环和规范表
            • 同义词环(Synonym Ring)是指一组含义大致相同的术语。
            • 规范表(Authority List)是描述性术语的受控词汇表,旨在促进特 定领域或范围内的信息检索
          • 分类法
            • 不同结构
              • 扁平分类法
                • 在受控类别集之间没有关系,所有类别都是平等的。这类似于列表。例如,一个包含多个国家的列表。
              • 层次分类法
                • 它是一种树结构,其中节点通过规则相互关联。
              • 多重层级结构
                • 它是具有多个节点关系规则的树状结构。
              • 面分类法
                • 它指的是每个节点与中心节点相关联,其形状看起来像星形图。
              • 网状分类法
                • 既可用于层级结构,也可用于刻面结构
          • 分类方案和打标签
          • 主题词表
            • 主题词表(Thesauri)又称叙词表,是一种用于内容检索的受控词 表。它结合了同义词列表和分类方案的特征。主题词表提供相关的每个 术语及其与其他术语的关系信息
          • 本体
            • 本体(Ontology)是一种分类法,它代表一套概念和它们在某个领 域内概念之间的关联
        • 文件和档案
          • 概要
            • 文件
              • 文件(Document)是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象。文
            • 档案
              • 档案可用于证明所做的决策和所采取的行动是符合程序的;可作为组织业务活动和法规遵从的证据。
          • 文件管理
            • 管理文件和档案的生 命周期包括
              • 编目
                • 识别已有的和新建的文件/档案。
              • 制度
                • 文件/档案制度的创建、批准和实施,包括文件/档案的保管制度。
              • 分类
                • 文件/档案的分类
              • 存储
                • 纸质和电子文件/档案的短期和长期存储。
              • 检索和流转
                • 在遵守制度、安全、控制标准和法律的情况下,允许文件/档案的访问和流通。
              • 保存和处置
                • 在遵守组织需求、规章和法规的情况下,对文件/档案进行归档和销毁。
          • 档案管理
            • 档案管理包括整个档案的生命周期:从档案的创 建或接收到处理、分发、组织和检索,再到处置
            • 精心管理的档案具备以下特点
              • 内容
                • 内容必须准确、完整和真实。
              • 背景
                • 关于档案的创建者、创建日期或与其他档案关系的描述性信息(元数据)应该在创建档案时收集、组织并维护。
              • 及时性
                • 档案应该在事件、行为或决定发生后立即创建。
              • 永久性
                • 一旦成为档案,则在档案的法定保存期内不能改变其内容。
              • 结构
                • 档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上。
          • 数字资产管理
        • 数据地图
          • 数据地图(Data Map)是所有ESI数据源、应用程序和IT环境的清单,其中包括应用程序所有者、保管人、相关地理位置和数据类型等信息。
        • 电子取证
          • “取证”(Discovery)是一个法律术语,指诉讼的预审阶段,双方当事人互相要求对方提供信息,以查明案件事实,并了解双方的论点有多强。
        • 信息架构
          • 信息架构是为信息体或内容创建的结构
          • 包括以下组件
            • 1)受控词表。2)分类法和本体。3)元数据映射。4)搜索功能规格。5)用例。6)用户流。
        • 搜索引擎
        • 语义模型
          • 语义建模(Semantic Modeling)是一种知识建模,描述一系列概念网络(有关的想法或主题)以及它们之间的关系。
        • 语义搜索
          • 语义搜索(Semantic Search)侧重于语义和语境而非预先设定的关键字。
        • 非结构化数据
          • 存储、完整性、安全性、内容质量、访问和有效使用对非结构化数据的管理都具有指导作用。
        • 工作流
    • 9.2 活动
      • 规划生命周期的管理
        • 概要
          • 文件管理实践涉及文件生命周期的规划——从文件的创建或接收文 件后的分发、存储、检索、归档和潜在的销毁。规划包括开发分类/索 引系统和分类法,以实现文件的存储和检索。重要的是,生命周期规划 中需要为档案建立具体的制度。
        • 规划档案管理
        • 制定内容策略
          • 内容管理计划应直接支持组织以有效和全面的方式提供相关和有用的内容。
      • 创建内容处理制度
        • 制定的制度中需要描述行为的原则、方向和指南等信息,以帮助员工理解并遵守文件和档案管理的要求。
        • 其他制度
          • 社交媒体制度
          • 设备访问制度
          • 处理敏感数据
          • 应对诉讼
            • 组织应通过有前瞻性的电子取证措施,为时刻可能的诉讼请求做好准备(报最好的希望,做最坏的打算)。
      • 定义内容信息架构
        • 数据管理专业人员在处理非结构化数据和内容的参考数据及元数据 时,可能会涉及受控词汇表和术语
      • 实施的声明周期管理
        • 获取档案和内容
        • 管理版本的控制
          • ANSI 859标准基于数据的重要性以及数据损坏或不可用时可能造成的损害,将数据控制分为3个等级:正式、修订和托管。
        • 备份和恢复
          • 文件/档案管理系统需要包含在组织的整体企业备份和恢复活动 中,包括业务连续性和灾难恢复计划
        • 管理保管和处置
        • 审计文件/档案
      • 发布和分发内容
        • 开放访问、搜索和检索
        • 通过可接受的渠道分发
    • 9.3 工具
      • 企业内容管理系统
        • 文件管理
          • 文件管理系统是用于跟踪和存储电子文件和纸质文件的电子影像的 应用程序
          • 一些文件管理系统拥有工作流模块,可以支持不同的工作流,如:1)手动工作流,指示用户将文件发往何处。2)基于规则的工作流,通过制定规则指示文件在组织内的流向。3)动态规则,允许基于内容的不同工作流。
        • 内容管理系统
          • 内容管理系统(Content Management System,CMS)用于收集、组织、索引和检索内容,将内容存储为组件或整个文件,同时保持组件之间的链接。
        • 内容和文件工作流
      • 协作工具
        • 协作工具(Collaboration Tools)可用于收集、存储、工作流程和管理与团队活动相关的文件。
      • 受控词汇表和元数据工具
      • 标准标记和交换格式
        • 可扩展标示语言( XML)
        • 基于JavaScript语言的轻量级的数据交换格式( JSON)
        • 资源描述框架(RDF)和相关的万维网联盟(W3C)规范
          • RDF以主语(资源)-谓语(属性名称)-宾语(属性值)表达式或 三元组的形式来描述资源
      • 电子取证技术
    • 9.4 方法
      • 诉讼应诉手册
      • 诉讼应诉数据映射
    • 9.5 实施指南
      • 就绪评估/风险评估
        • 概要
          • ECM关键成功因素包括对现有内容的审核和分类、合适的信息体系结构、内容生命周期的支持、适当元数据标签的定义以及在ECM解决方案中自定义功能的能力。
        • 档案管理成熟度
          • ARMA有一个信息治理成熟度模型,它可 以帮助组织评估档案保存计划和实践
          • 信息治理成熟度模型分为5个等级
            • 1级,低于标准的
              • 信息治理和档案保管问题没有得到解决或只是最低限度的解决。
            • 2级,发展中的
              • 认识到信息治理和档案保管可能对组织产生的影响。
            • 3级,基本的
              • 必须满足法律法规的最低要求。
            • 4级,积极的
              • 已经建立了一个以持续改进为重点的主动式信息治理计划。
            • 5级,完成变革的
              • 信息治理已经融入企业的基础架构和业务流程中。
          • 档案管理系统和应用程序的技术评估
            • 1)电子档案管理软件应用系统设计标准(DoD 5015.2)。2)电子办公环境中档案管理原则与功能要求(ISO 16175)。3)电子档案管理通用需求(MoReq2)。4)对象管理组(OMG)的档案管理服务(RMS)规范。
        • 电子取证评估
          • 成熟的规划将明确规定角色和职责、保存协议、数据收集方法和披露流程。
      • 组织和文化变革
        • 隐私、数据保护、机密性、知识产权、加密、道德使用和身份,这应是文件和内容管理专业人员与其他员工以及管理层和监管机构合作一起处理的重要问题。
    • 9.6 文件和内容治理
      • 信息治理架构
        • 驱动因素
          • 1)法律和法规遵从。2)档案的合理处置。3)对电子取证的前瞻性准备。4)敏感信息的安全。5)电子邮件和大数据等风险领域的管理。
        • 信息治理参考模型
          • 图9-4 信息治理参考模型
          • 外环包括了实施信息管理过程中涉及的制度、标准、流程、工具和基础架构等方面,中心展示了一张生命周期图。IGRM是对ARMA的GARP®的补充。
      • 信息的激增
      • 管理高质量的内容
        • 定义高质量的内容需要了解它生产和使用的背景,
          • 1)生产者。谁创建内容?为什么要创建?2)消费者。谁使用信息?出于什么目的?3)时间。何时需要信息?需要多久更新或访问一次?4)格式。消费者是否需要特定格式的内容才能实现目标?是否有不可接受的格式?5)分发。信息将如何分发?消费者将如何获取信息?如何实施安全措施以防止对电子内容的不恰当访问?
      • 度量指标
        • 概要
          • 关键业绩指标(KPI)是衡量组织绩效与目标的定量和定性指标。可以在战略和运营层面制定关键绩效指标。
        • 档案管理
          • 在战略层面,可以在档案管理法规遵从(如满足要求所花费的时间)和/或治理(如遵守制度)方面制定KPI。在运营层面,可以在档案管理资源(如运营和资本成本)、培训(如给定的类别数量、受过培训的员工数量及水平)、日常档案管理服务的提供与操作(如满足用户服务水平协议(SLA)的百分比)和/或档案管理功能与其他业务系统的整合(如集成的百分比)等方面制定KPI。
        • 电子取证
          • 电子取证常见的一个KPI指标是成本降低,另一个KPI指标是对比被动收集信息的方式,提前收集信息时提高的效率(如转为电子取证平均需要几天时间)。
        • 企业内容管理
          • 应制定KPI来衡量企业内容管理(ECM)的有形和无形效益。有形效益包括提高生产力、降低成本、提高信息质量和改善合规性;无形效益包括增进协作、简化工作程序和工作流。
  • 考察分值&知识点
    • 考察分值
      • 2分

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2197369.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于uniapp+django微信小程序 食品安全信息管理系统

目录 项目介绍具体实现截图开发者工具介绍技术路线性能/安全/负载方面开发语言以及框架介绍python-flask核心代码部分展示python-django核心代码部分展示详细视频演示源码获取 项目介绍 食品安全信息管理系统设计的目的是为用户提供食品信息、科普专栏、食品检测、检测结果、交…

力扣LeetCode-链表中的循环与递归使用

标题做题的时候发现循环与递归的使用差别: 看两道题: 两道题都是不知道链表有多长,所以需要用到循环,用到循环就可以把整个过程分成多个循环体,就是每一次循环要执行的内容。 反转链表: 把null–>1…

【图论】迪杰特斯拉算法

文章目录 迪杰特斯拉算法主要特点基本思想算法步骤示例 实现迪杰斯特拉算法基本步骤算法思路 总结 迪杰特斯拉算法 迪杰特斯拉算法是由荷兰计算机科学家艾兹赫尔迪杰特斯拉(Edsger W. Dijkstra)在1956年提出的,用于解决单源最短路径问题的经…

动态规划算法题目练习——91.解码方法

1.题目解析 题目来源:91.解码方法——力扣 测试用例 2.算法原理 基础版本 1.状态表示 由于题目只要求返回第i个位置的可能情况,则只需要开辟n(ns.size())个大小的dp表即可 2.状态转移方程 题目可知第i个位置可以单独解码也可以与前一个位置组合解码&am…

通付盾|打造新型信息基础设施

2024年9月4日,工业和信息化部、中央网信办等十一部门联合印发《关于推动新型信息基础设施协调发展有关事项的通知》,从全国统筹布局、跨区域协调、跨网络协调、跨行业协调、发展与绿色协调、发展与安全协调、跨部门政策协调等方面明确了21条具体举措&…

命名管道Linux

管道是 毫不相关的进程进程间通信::命名管道 管道 首先自己要用用户层缓冲区,还得把用户层缓冲区拷贝到管道里,(从键盘里输入数据到用户层缓冲区里面),然后用户层缓冲区通过系统调用(write)写…

【JavaEE】——文件IO

阿华代码,不是逆风,就是我疯 你们的点赞收藏是我前进最大的动力!! 希望本文内容能够帮助到你!! 目录 一:认识文件 1:文件的概念 2:文件的结构 3:文件路径…

电脑好用便签怎么用,好用的便签软件让你轻松提高工作效率

在忙碌的工作中,作为一名牛马打工人,我们经常需要记住许多重要的事项和任务。有时候,简单的脑力记忆可能会让我们遗漏一些事情,而一个好用的便签软件就可以帮助我们解决这个问题,提高我们的工作效率。那么,…

四.python核心语法

目录 1.序列 1.1. 索引 1.2. 切片 1.3. 总结 2.加法和乘法 2.1. 加法 2.2. 乘法 3.常用函数 3.1.sum()函数 3.2.max()函数和min()函数 3.3.len()函数 4. list 列表 [ ] 基本操作 4.1. 列表的定义 4.2. 列表的创建(list()函数) 4.3. 列表的…

实施BADI增强支持多个活动的增强实施

找到一个BADI之后,在SE18里面输入BADI名称 一定要查看当前BADI是否支持多种用法,即同一个BADI定义可以实施多个BADI增强。 1、勾选多种用法,才能新实施BADI增强,支持多个实施可同时是活动的。 2、未勾选多种用法,只…

C++——STL简介

目录 一、什么是STL 二、STL的版本 三、STL的六大组件 没用的话..... 不知不觉两个月没写博客了,暑假后期因为学校的事情在忙,开学又在准备学校的java免修,再然后才继续开始学C,然后最近打算继续写博客沉淀一下最近学到的几周…

Echarts实现订单数据统计,前端+后端 代码

以下是静态统计图可以直接看到统计图,复制粘贴即可看到效果,但是数据是死的。下面我会介绍一种动态的方法 ,后端动态返回,基于订单页面的数据,来渲染统计图。 Vue 安装 Echarts npm i echarts -S 静态 : …

粉碎玉米的机器:水滴式饲料粉碎机

水滴式饲料粉碎机的主要工作原理是利用高速旋转的锤片将饲料原料进行粉碎,同时将粉碎后的饲料颗粒进行搅拌和混合。这种设备结构紧凑、操作简单、维护方便,可以满足不同养殖场的需求。 水滴式粉碎机特点: 水滴式粉碎机是一款高效、多功能的机…

无人机之飞行算法篇

无人机的飞行算法是一个复杂而精细的系统,它涵盖了多个关键技术和算法,以确保无人机能够稳定、准确地执行飞行任务。 一、位置估计 无人机在空中飞行过程中需要实时获取其位置信息,以便进行路径规划和控制。这通常通过以下传感器实现&#…

(计算机毕设)基于Vue和Spring Boot的宠物救助网站设计与实现

博主可接毕设!!! 毕业设计(论文) 基于Vue和Spring Boot的宠物救助网站设计与实现 摘 要 随着中国互联网的迅猛发展,传统宠物救助领域面临着信息管理繁琐、辐射范围有限、信息传播受限、丢失宠物找回几率较…

PAT甲级-1004 Counting Leaves

题目 题目大意 给定一棵树,每个节点从01到n编号,规定01为根节点,求每层叶子节点的个数。 思路 用二维数组存储树。每层叶子节点的个数,只能用dfs深度遍历,用一个数组存储所有层数的叶子节点个数。相同层数并且是叶子…

蓝桥杯—STM32G431RBT6(IIC通信--EEPROM(AT24C02)存储器进行通信)

一、什么是IIC?24C02存储器有什么用? IIC (IIC 是半双工通信总线。半双工意味着数据在某一时刻只能沿一个方向传输,即发送数据的时候不能接收数据,接收数据的时候不能发送数据)即集成电路总线(…

力扣hot100--链表

链表 1. 2. 两数相加 给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。 请你将两个数相加,并以相同形式返回一个表示和的链表。 你可以假设除了数字 0 之外&#xff…

不知道是你的损失,盘点8个可能被忽略的极空间宝藏功能与使用技巧

不知道是你的损失,盘点8个可能被忽略的极空间宝藏功能与使用技巧 哈喽小伙伴们好,我是Stark-C~ 极空间作为后起之秀的新势力NAS,它的产品不管是做工、性能、用户体验等方面都表现非常出色,它独家搭载的ZOS系统不管是功能性还是可…

计算机毕业设计 基于Python的食品销售数据分析系统的设计与实现 Python毕业设计 Python毕业设计选题 数据分析 Vue【附源码+安装调试】

博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ 🍅文末获取源码联系🍅 👇🏻 精…