仅供学习使用
An original Data, Information and Knowledge management approach for model-based engineering projects
作者:M. El Alaoui, S. Rabah, V. Chapurlat, V. Richet , R. Plana
来源:https://doi.org/10.1016/j.ifacol.2022.10.135
文章详细介绍了DIK管理在关键基础设施领域的重要性,并介绍了提出的方法。本文的主要贡献是基于现有DIK管理策略和原则的方法,其概念部分关注如何探索现有的本体,以及如何将它们进行语义对齐和合并,以创建更适用和明确的SE本体。该本体将在大型工程项目中进行填充、验证和实际应用。
在基于模型的工程(MBSE)项目中,提出了一种全新的数据、信息与知识管理方法。文章指出,数据Data, 信息Information和知识Knowledge的问题变得越来越重要,许多研究努力都致力于在这个领域取得进展。这些问题的特征,比如数据量volume、多样性variety、变异性variability等,已经被传统方法所研究,并提出了一些解决方案。同时,MBSE,特别是在能源基础设施等领域,促使使用模型来代替传统文件,从而增加了数据、信息与知识的复杂性和量。在这种情况下,文章认为有必要将已有的数据、信息与知识管理进展与基于模型的系统工程方法相结合,以满足MBSE的需求。文章首先对数据、信息与知识进行了定义,然后检查了在大型基于模型的工程项目中,如何帮助项目利益相关者在较长或较短的时间内有效地使用和管理这些数据、信息与知识。最后,文章提出了一种方法,旨在填补基于模型的系统工程与所谓数据管理领域之间的预期差距。
DIK 定义
在整个系统工程过程中,不同的活动会产生各种模型,如需求工程或架构工程。不论这些模型的性质、格式、目标和用途如何,它们在某个时刻都可以被有效地归类为以下几种情况:
- 数据Data:任何模型都是由项目利益相关者根据其特定目标和观点构建的,因此必须在上下文中加以说明,以便其他利益相关者能够理解;或者
- 信息Information:当模型被视为信息时,它将成为所有利益相关者都能够理解且明确的信息来源,这些利益相关者能够进一步细化、改进或质疑它,或者用它来构建自己的表示;或者
- 知识Knowledge:例如,某个模型可能会形式化一个建模模式,该模式可重用且可定制,适用于各种目的。这时,该模型可以被视为知识,考虑到任何经过验证和证实的模式;或者
- 容器Container:其中包含、展示和将各种数据、信息和/或知识放入上下文,这些数据、信息和/或知识可能与处理、共享和追踪相关。
DIK 特征描述
在大多数工程项目中,这些Data、Information和Knowledge具有如下特征:
- 数据量Volume:以大小和数量来衡量,使得能够管理大量不同大小的DIK变得至关重要。
- 多样性Variety:DIK可能以不同类型和格式出现,来源和容器各异,彼此之间存在各种复杂的依赖关系,这增加了它们的结构化、组织和利用的难度。
- 变异性Variability:DIK的值在不断变化,例如,某个元素在某一时刻可能是准确的,但可能在另一时刻变得过时,需要进行更新。这会导致版本的变化,以应对DIK的变化。
- 速度Velocity:另一个重要概念是DIK的创建和演化速度,以及现有DIK的修改速度(与“数据量”和“变异性”维度紧密相关);
- 真实性Veracity:DIK的真实性可能是应该密切监控和监督的最重要方面之一,因为如上所述,它可能会经常性地突然发生变化。在工程项目中,由于显而易见的原因,其重要性是最高的;不可靠或过时的元素可能会导致灾难性的损失(例如时间、预算、资源等),试图解决其可能引起的错误或失误(例如返工)。这些损失的影响和严重程度在很大程度上取决于活动领域和项目阶段。
“Veracity”的两个方面。第一个方面涉及DIK的质量,即DIK是否具有一致性、非歧义性、相关性、成熟性和非过时性。同时,还需要确保DIK是唯一的,没有重复项,并且是否达到了所需的详尽性。第二个方面则涉及对DIK的信任程度,即DIK有多么可信、可接受、可靠、合理和现实。
DIK 相关问题
利用问题exploitation
关注点是如何探索、导航和展示DIK,以及相关的存储、管理和处理。这包括将DIK进行转换、模拟、建模、验证和确认等操作。这个问题主要与DIK的有效利用和应用有关。
解释问题interpretation
这方面的问题涉及到DIK的可视化、确信度和表示。具体来说,如何在不同背景和领域的众多利益相关者之间进行有效的沟通和理解,以及如何选择适合不同沟通和交流需求的表示语言。还要考虑现有的DIK表示方法和工具,以及如何在它们之间进行选择。
语义问题semantics
语义问题的解决对于有效理解和消除歧义非常重要。为了达到这个语义目标,需要满足两个条件:
- 共同的、有限但足够形式化的语言:交流的参与者需要使用共同的语言,这种语言应当是有限但足够形式化的,以确保彼此的理解。在工业领域尤其重要的是,参与者需要确保使用相同的术语来指代相同的事物或概念。
- 共享的上下文:语言在特定的上下文中才具有明确的含义。同一个词在不同的上下文中可能会有不同的含义。因此,为了确保交流的准确性,需要建立一个共享的上下文,以便各方可以理解特定术语或词汇的含义。
追溯性问题traceability
-
DIK本身的追溯性:这涉及将每个DIK元素与其相关的、依赖的或引用的项目进行关联,从而创建一个依赖层次结构。这有助于跟踪DIK元素之间的关系,了解它们之间的依赖关系。
-
对DIK操作的追溯性:我们需要能够追踪谁对DIK进行了哪些操作,以及何时进行了这些操作。这对于责任追究等方面是必要的。这种追溯性可以帮助识别DIK的变更历史,以及操作的执行者和时间,从而在需要时进行溯源和解决问题。
互操作性问题interoperability
互操作性指的是以一种不会丢失语义(无语义损失)、高效(没有元素浪费)且一致(在时间、努力和质量方面一致)的方式交换元素的能力。互操作性的四个级别包括工具、数据、流程和公司级别。而要达到这些互操作性级别,需要对DIK的不同方面进行完全的掌握
安全性问题security
- 安全访问:确保对共享的DIK的访问是安全的,防止未经授权的访问、数据泄露或恶意操作。在DIK的交流和共享过程中,需要采取适当的安全措施,以确保只有授权的人员能够访问和处理DIK。
- 知识产权尊重:在共享DIK的过程中,需要尊重知识产权,包括保护原创性和确保知识创作者的权益。这意味着在共享DIK时,需要遵循适用的法律和规定,以确保不侵犯知识产权。
不在具体工作内但重要的问题
- 道德问题:DIK善意的利用
- 环境问题:减少对环境影响
DIK相关和存在的限制
问题的根源包括:
缺乏联合方法,无法在两个层面上考虑互操作性
尽管有许多研究集中在互操作性问题上,但没有真正的共识,也没有联合方法来同时解决不同层面的互操作性问题,尤其是:
-
语义消除歧义。已经证明且明确无歧义的系统工程概念定义仍然有限,即使通过一个或多个一致的系统工程本体论进行形式化,最终可能通过考虑基于模型的系统工程(MBSE)或基于模型的系统的系统(MBSSE)原则来丰富或引导。
-
建模语言和模型的互操作性,正如(Zacharewicz等人,2020)所讨论的,他们试图连接企业建模、企业互操作性和使用模型来为系统工程方法做出贡献并丰富它们。
-
工具的互操作性:采用中立的文件和格式进行技术数据交换的标准已经存在(例如,ISO 10303应用协议AP233(AP233)旨在捕获系统工程环境中的信息交换的语义),但大型项目需要各种工具,这些工具更多或少的专门化,从而导致建立和维护所需的互操作性水平变得困难。
有效的DIK V&V方法
在项目的整个生命周期中,必须考虑DIK的真实性和最新价值,同时兼顾其它体积、变异性、速度和多样性等特征。为此,在使用和集成这些DIK之前,专门的验证和验证方法仍然不足以实现这些目标;
结构化和组织
逐步对所有DIK进行结构化和组织,考虑到不断增长的体积、多样性(例如,异构的格式)和变异性(例如,所谓的DIK生命周期)。在整个项目过程中,这需要考虑预期的用途(例如,存档、追溯、转换、计算等)以及项目利益相关者的习惯;
安全性
尽管这个问题很常见,但在一方面,尚缺乏专门针对基于MBSE项目背景下的DIK安全性的明确标准和协议,另一方面,知识产权管理也是一个挑战。
项目观察支持分析
具体案例见论文原文
项目中观察到的问题,这些问题与之前提到的困难有关。在这个实际项目中,问题涉及到了DIK管理的多个方面:
- 体积:目录中注册的备件数量庞大,每个备件都有多个属性需要保持最新。众多的利益相关者来自不同的组织和业务单位,参与了项目。
- 多样性:不同组织的利益相关者需要使用不同的数字工具进行DIK管理,这些工具不完全互操作,导致交流困难。
- 变异性:由于备件在维护操作中不断变化,其属性也会发生变化。供应商可能对备件的属性进行更改。
- 速度:在核领域,备件的变化速度可能很快,需要及时更新备件目录。
- 真实性:备件相关的DIK必须始终保持最新,以反映实际情况。
在这个项目中也观察到了一些较大规模的问题,例如备件目录不时更新、交付不及时或不符合需求、目录中存在过时或重复的部件等。为了解决这些问题,采用了一种方法,即跟踪备件的生命周期并使用模型作为沟通和表示的工具。在项目结束时,提供了一个数字化的流程模型,描述了备件操作、执行操作的参与者以及参与者之间的互动。这个模型成为了与不同利益相关者沟通的基础,并识别出了一些短期内解决问题的改进机会,如减少人为错误、自动化流程等。
然而,文中指出这些解决方案只是暂时性的修复,没有考虑之前提到的所有问题。因此,这个工作的预期贡献是提供一个更加稳健和持久的解决方案,通过一种新的方法来管理DIK及其特性,从而在DIK的整个生命周期中解决问题,简化DIK的搜索、利用、使用和重复使用。这将有助于更好地解决DIK管理中的各种困难和问题,使项目能够更加有效地进行。
思路贡献:基于本体的SE相关DIK方法(MoDIK)
文章提出的贡献是一种被称为“MoDIK”的方法,旨在在SE项目背景下提供DIK管理原则。其主要目标是提出一种新的方法,用于在大型工程项目中生成、处理和共享的DIK系统的结构化、组织、存储等管理方式。这个方法将考虑到第2节中定义的DIK特征和问题,并有望为DIK的寻找、交换、追踪和资本化的新方式的定义做出贡献,跨足由一个项目到另一个项目。
方法要素
该方法由五个关键要素组成,这些要素对于建立高效方法至关重要:
-
概念:描述和定义所有概念,概念之间的关系以及这些概念和关系的属性,所有这些都需要模型化DIK管理所涉及的领域和业务领域。这包括定义一个共享的词汇表,并对其进行形式化,以确保所有这些元素已经在事前被识别、形式化、检查和验证,并以正确和相互的方式使用。
-
语言:为了让用户能够处理和使用先前定义的词汇表,该方法应提供各种语言,即面向领域的建模语言(DSML),用于建模、仿真或分析目的。这些DSML基本上由以下内容定义:
- 1)定义哪些来自词汇表的概念和关系受到关注的抽象语法,
- 2)一个或多个具体语法,允许图形或文本呈现,符合抽象语法,从而使最终用户能够获得与其用途和习惯相对应的表示,
- 3)操作语义,由解释规则和属性组成,从而有利于对构建模型内容进行形式化分析和仿真。在文献中,DSML的抽象语法是考虑到最终用户要求的不同视图和观点(例如,需求工程视图、行为视图或架构视图)而定义的。存在各种现有的DSML,并且必须将它们整合到方法中。还可以从头开始定义其他DSML,或从现有DSML中获得灵感,如SysML等,并寻找方法来改进和完善以满足DIK管理的要求。
-
过程:目标是在实际用例中定义、结构化和组织在应用方法过程中需要遵循的操作。这些过程需要足够清晰和易于理解,以允许用户逐步使用所构建的方法,并应用先前定义的语言。
-
工具:任何方法都必须由方法论和信息技术工具和手段支持,使最终用户能够使用所提供的DSML创建和制定模型,并遵循指定的过程。
-
专业知识和实验:其目的是强调并提供各种实验、参考模型、相关标准、识别出的模式以及支持最终用户获取和应用方法的教材。这些资源可以帮助最终用户获得和应用该方法。
目前完成的工作和未来安排
已完成的工作集中在概念、属性和关系的词汇方面。作为之前图1和图2中呈现的结果的补充,接下来的步骤包括:
- 分析现有的工作,包括1) 与SE和MBSE相关的概念,例如区分SE本体论(Lopez等,2020)和元模型(Maleki等,2018),面向领域的建模语言(DSML)(Laurenzi等,2018),模型类型(架构、需求库、建议、决策等),以及模型管理;2)应用于DIK形式化、处理和管理的数据科学。
- 在一个或多个可互操作的本体中对整个内容进行形式化,汇总到一个名为MoDIK本体的本体中。
- 通过结合经典数据分析方法(自顶向下方法)的反馈和与最终用户的研讨会(自底向上方法)的反馈来验证MoDIK本体。
(Gruber, 1993)将本体定义为:“本体是对概念化的明确规范。这个术语借用自哲学,哲学中的本体是存在的系统描述。”换句话说,本体是一种主要用于计算机科学领域,特别是知识工程和人工智能领域的知识表示方法。 (Broekstra等,2002)解释了用于定义本体的概念化,它指的是给定领域的抽象模型,用来识别和定义该领域的代表性概念。此外,他们指出本体具有以下特点:
- 明确性:使用的概念和对其使用的限制必须得到明确和明确地定义;
- 形式化:本体必须足够形式化,以便系统能够理解输入信息的语义;
- 共享和共同的:本体代表一种共识知识,不仅仅局限于少数个体,而是被整体接受。
获得的本体随后被建模为领域的知识图谱,将概念和属性分别表示为节点和属性,将边表示为关系。在本体的软件工程(SE)领域,本体的应用并非新闻,事实上,许多尝试都曾经建立过SE本体。实际上,(Yang,Cormican和Yu,2019)在他们的现有技术综述中提出了一个完整的表格,其中显示了现有本体的参考文献、范围、关键概念和关键属性等内容。从这个表格中可以得出结论,在SE和MBSE领域,已经进行了许多尝试来创建适用于SE的功能性本体,然而,这些倡议存在以下问题:
- 本体不完整:从杨等人的研究中可以看出,每个现有的本体都涵盖了SE的某个方面,这意味着其中没有一个实际上涵盖了SE的所有概念和方面;
- 本体在语义上不一致:一些本体使用不同的术语来描述相同的概念,而不一定会创建相应的链接以保证语义的一致性,这违反了本体的基本原则;
- 一些概念在一些本体中存在,而在其他本体中缺失,或者被其他概念替代(这在不同的SE语言中也有所观察)。这本身并不是一个问题,但需要进行充分的文档记录和形式化描述。
因此,MoDIK本体的规范基于现有的本体,并旨在在语义上进行对齐。
为此,一个针对的利益相关者清单(例如,赞助商或项目经理、客户、操作员或用户,甚至是反对系统的人)及其期望和目标已在详尽的研究中进行了描述,如在DIK的创造阶段的摘录所示,这些摘录详细说明了这些利益相关者在使用过程中的期望和目标。该结果正在被所述的利益相关者验证和验证,以防止在工作后出现未来的误解或错误。这要求通过创建可用类的实例来填充MoDIK本体。
个人思路扩展
MBSE本体
本体(Ontology)是一个在计算机科学和信息科学领域使用的术语,用于描述事物之间的概念、关系和属性。本体是一种知识表示方法,旨在形成一个共享的、一致的语义模型,以便人们能够更好地理解、沟通和处理领域中的信息。
本体的一个重要特征是它的形式化性质。本体通常使用形式化的语言来定义概念、关系和属性,以确保它们可以被计算机理解和处理。这使得本体可以用于知识工程、人工智能、语义网和其他领域中,用于构建智能系统、信息检索、数据集成等任务。
在模型驱动的系统工程(Model-Based Systems Engineering,MBSE)中,本体指的是用于描述系统工程领域内概念、实体、关系和属性的形式化模型。MBSE使用本体来建立一个共享的、一致的语义框架,以促进不同模型和工具之间的互操作性、数据共享和标准化。
在MBSE中,本体用于定义系统工程领域中的基本概念、术语和关系,以及这些概念之间的联系。通过建立一个统一的本体,可以消除模型之间的歧义,确保不同利益相关者可以更好地理解和共享模型数据。本体还可以提供一种共同的语义框架,使得模型可以在不同工具之间进行交互,而不会因为术语和语义的差异而导致混淆。
在MBSE中,本体可以帮助定义系统的各个方面,如需求、功能、体系结构等。通过使用本体,可以建立一个一致的模型体系,使得不同领域的专家和利益相关者可以更好地协同工作,确保模型数据的一致性和准确性。
语义对齐和整合
语义对齐和整合是将不同本体中的概念、术语和关系进行匹配和协调,以确保它们在语义上一致和可交互。
- 本体分析:首先,需要对现有的本体进行详细的分析,了解它们的结构、概念和关系。这包括识别每个本体中的核心概念、属性和关系。
- 概念映射:将现有本体中的概念与目标本体中的概念进行映射。这可能需要定义映射规则,以确定两个本体中概念之间的相似性和关联性。
- 语义匹配:对映射后的概念进行语义匹配,以确定它们在语义上的一致性。这可能涉及使用语义相似度度量来比较概念之间的语义相似性。
- 术语对齐:确保不同本体中的术语和术语定义保持一致。这可能需要建立术语映射表,将不同术语对应到相同或相似的含义。
- 关系整合:将不同本体中的关系进行整合,以确保它们在语义上的一致性。这可能需要定义关系映射规则,以确定两个本体中关系之间的对应关系。
- 语义标注:为本体中的概念、属性和关系添加语义标注,以明确它们的含义和语义。这有助于确保不同利益相关者理解和解释本体中的内容。
- 验证和验证:对整合后的本体进行验证和验证,以确保概念和关系的一致性和正确性。这可能包括使用本体推理引擎来检查逻辑一致性和推断。
- 利益相关者参与:重要的是让不同的利益相关者参与到语义对齐和整合的过程中,以确保本体的内容能够满足他们的需求和期望。
示例
一个公司正在进行两个不同领域的系统工程项目,一个是关于“飞机”(Aircraft)的项目,另一个是关于“火车”(Train)的项目。
本体1:飞机(Aircraft)本体
- 概念:客机、货机、直升机
- 属性:最大载重、航程、座位数
本体2:火车(Train)本体
- 概念:高速列车、货运列车、地铁
- 属性:最大载重、行驶速度、座位数
在这个示例中,我们可以看到这两个本体有一些相似的概念和属性,如“最大载重”和“座位数”。但是,由于飞机和火车在不同领域,它们的术语和特点也有所不同。
以下步骤来进行语义对齐和整合。
(1)概念映射: 我们可以将“飞机”本体中的“客机”概念与“火车”本体中的“高速列车”概念进行映射,因为它们在不同领域中可能有类似的角色。
(1)术语对齐: 我们可以将“飞机”本体中的“货机”术语与“火车”本体中的“货运列车”术语进行对齐,因为它们在不同领域中可能表示类似的运输方式。
(1)属性对齐: 我们可以将“飞机”本体和“火车”本体中的“最大载重”属性进行对齐,因为它们在两个本体中都是描述载重能力的属性。
通过这样的对齐和整合,我们可以创建一个新的本体,其中概念、术语和属性得到了映射和协调。这个新的本体将有助于在不同领域的系统工程项目之间实现更好的数据共享和互操作性,从而提高项目的效率和合作。
MBSE项目中的数据和模型的一致性
数据的一致性
- 共享的本体: 使用共享的本体来定义项目中所涉及的核心概念和关系。本体作为一种知识表示方法,可以确保不同团队和系统之间对数据的理解是一致的。
- 语义对齐: 对现有的本体进行语义对齐,确保不同本体中相似的概念具有相同的含义。通过建立语义映射,可以消除不同本体之间的概念混淆。
- 整合数据源: 将来自不同数据源的数据进行整合,确保数据的一致性和准确性。采用一致的数据格式和规范有助于避免数据混乱和误解。
模型的一致性:
模型的一致性
- 标准化的数据模型:制定标准化的数据模型,定义模型的结构、属性和关系。这有助于确保不同模型之间的一致性,使其具有可比性和可理解性。
- 共同术语和定义: 在项目团队和利益相关者之间制定共同的术语和定义,以确保模型中的概念和关系具有一致的解释和理解。
- 语义一致性: 确保模型中的概念和关系在语义上一致,以便不同团队可以准确地理解和解释模型的内容。
- 模型模板: 制定标准的模型模板,定义模型元素的结构和属性。模板可以作为基础,确保不同模型之间具有一致的结构和表示。
MBSE模型数据标准化(不太明确)
MBSE项目中,为了解决数据、信息和知识管理问题,制定一套共同的规范和规则,以确保在项目中创建、维护和共享的模型具有一致性、可互操作性和可理解性。
- 数据结构: 确定模型的基本结构、概念和关系。例如,定义哪些实体和属性应该在模型中出现。
- 术语和定义: 制定一致的术语和定义,以便在不同的项目和团队中,相同的概念可以用相同的术语来表示。
- 语义一致性: 确保模型中的概念和关系在语义上一致,以便不同的人可以准确地理解和解释模型的内容。
- 标准化的模型元素: 定义一套通用的模型元素,如符号、图标、图例等,以提高模型的可读性和可理解性。
- 交换格式: 定义一种标准的数据交换格式,以便不同系统和工具可以相互交换模型数据。
文章中提到的下面两个文章也许有帮助(待学习):
- Zacharewicz, Gregory, et al. “Model Driven Interoperability for System Engineering.” Modelling, vol. 1, no. 2, Oct. 2020, pp. 94–121, https://doi.org/10.3390/modelling1020007.
- ISO 10303 Application Protocol AP233