信息技术中的本体与哲学的本体论是不同的,它代表了某个专业领域的基本概念,它们在智能制造和工业4.0 中具有不可或缺的作用,为了实现人与机器,机器与机器之间的确定性操作。一个标准化的,精确定义的本体服务是非常重要的。这是数字化制造过程中的基础工作。
信息技术中的本体论是为了构建知识库而提出的。使用本体论的技术,能够精确地构建各个行业的知识库。2023年突然就火了的chatGPT 也许改变了知识库构建和使用的方式。但是,对于目前的机器而言,仍然只能使用精确,形式化的知识库。
本体论(ontology)
本体(ontology)是哲学领域的话题,称为本体论。论述存在的本质。一旦涉及“存在”,这就进入形而上学的范畴了。这不是我们这里讨论的重点。我们讨论计算机科学领域的本体论。
信息技术的本体论
在信息技术中,经常提到本体论,但是信息技术中的本体论与哲学的本体论有天壤之别。
在信息技术中,Gruber(1993)给出本体(ontology)定义为:
Ontology 是一个概念化规范。
信息技术的本体论是构建一个概念体系的方法论。或者说本体是用于对概念及其关系进行建模的形式系统
- 一种方法学---以确立独立存在的概念(对象或实体)为基本目的,尽量采用精确的、计算机可处理的(或形式化的)表达方法。
- 一个体系---指用上述方法学所建立的体系,所谓概念化体系,或直接将它们称为“本体”(ontologies)。建立这种体系,通常是作为一种约定,从而对特定领域上的(计算机)表达与处理建立一个明确的基础。
由此可见,按照本体论的方法与准则建立一个本体论(体系)的过程,是一种抽象过程。信息技术中的本体,是指不可进一步分割的基本概念及其相互关系。
本体论之“本”是相对的、权宜的。能够解析为关系和是否解析为关系,取决于应用目的。;例如自动控制领域的本体,电气控制领域的本体和过程控制的本体等等。
在计算机领域建立一个 ontology,正是要在约定的使用情形中,对特定范围中的列基本概念及其关系建立规范化(计算机化)表达,使得不同的计算机应用可以使用它们,达成所指在计算机应用实体与模型的三种空间基础上的一致,即达成所谓语义的一致性,互操作性。
本体的存储
本体存储在资源描述框架RDF中。
RDF
90年代,有个叫Guha的人,在苹果公司研究各种各样的元数据格式来管理图片音频等数据,RSS就是他在那个时候发明的,随后在1997年他又发明了RDF。接着人们发现RDF这种形式非常适合用于在万维网上对知识的结构化表示,于是在1999年,RDF被W3C推为行业推荐标准。
RDF(Resource Description Framework),即资源描述框架.
RDF的基本单元是三元组(triple)
每个三元组是(主语 谓语 宾语)构成 。主谓宾的取值称为"资源".
RDF提出了一个简单的二元关系模型来表示事物之间的语义关系,即使用三元组集合的方式来描述事物和关系。三元组是知识图谱中知识表示的基本单位,简称SPO,三元组被用来表示实体与实体之间的关系,或者实体的某个属性的属性值是什么。
从内容上看三元组的结构为 “资源-属性-属性值” ,资源实体由URI表示,属性值可以是另一个资源实体的URI,也可以是某种数据类型的值,也称为literals(字面量)。
例:该RDF 说明,ex
:alice 知道ex
:
dave
,ex
:
carol 知道一个出身地的人,这个人的年龄是23岁。
对应的RDF
prefix ex: <http://example.org/>
prefix schema: <http://schema.org/>
prefix dbr: <http://dbpedia.org/resource/>
ex:alice schema:knows _:x .
_:x schema:knows ex:dave .
ex:carol schema:knows _:y .
_:y schema:birthPlace _:z ;
schema:age "23"^^xsd:integer .
ex:dave schema:birthPlace _:z .
RDF 的ID -URI
- URI:统一资源标识符,字符集被限制为US-ASCII(英文字符),通过指定唯一名称来标识资源;
- IRI:国际化资源标识符(Internationalized Resource Identifier),定义与URI相同,URI,只是将字符集扩展到通用字符集(包含了非英文字符),所以它是URI的超集,同样唯一标识了一个资源;
- URN: 统一资源名称(Uniform Resource Name),由命名空间标识符(NID)和命名空间特定字符串(NSS)组成;
- URL:统一资源定位符,即我们通常提到的网址,通常指的是不包含URN的URI子集
RDF 数据库
三元组结构的RDF 能够使用图模型描述,并且在数据库中存储RDF
GraphDB
是一个高效、强大的图形数据库, 支持RDF和SPARQL
Neo4j图数据库
一个开源的图数据库,它是一种属性图数据库。通过插件,也能够支持RDF。
本体论在工业4.0中的应用
工业4.0 代表了智能制造的未来,其核心是信息物理系统(CPS)的概念。制造设备包含了两个部分,一个是真实的物理设备,另一个是虚拟的信息模型。构建各种设备的信息模型成为一项重要的工作。
信息模型是计算机可识别,处理和传送的,因此它们必须是明确的,形式化的。信息模型中涉及了大量基本的概念,这些基本的概念模型就是行业的“本体”,例如机电行业,包括了许多基本的概念,诸如电压,电流等等。
为了保证基本概念的标准化和确定性,保证不同的软件厂商在概念模型保持一致,同时又能够共享基本的“本体”,这就促使各种标准化组织建立面向行业的“本体”标准。通常,标准化的“本体”是存储在数据库中,作为一种“服务”为工程服务的。不同厂商的各种软件能够访问这些本体服务器,获取本体的描述。
本体论旨在使领域知识明确化并消除歧义,使机器能够推理,并促进机器与人类之间,机器与机器之间的知识共享。
工业 4.0 本体论框架
- 设备本体-具有机器等概念
- 过程本体-具有技术设备执行的不同操作的分类
- 参数本体-具有服务质量等概念
- 产品本体-具有产品信息
- 基础本体-其他概念
人们还不断地构建各种工业4.0 时代的本体标准,例如:
- 机器人和自动化的核心本体论 (CORA)
- 自主机器人本体 (ROA)
- 机器人架构本体论 (ORArch)
与本体相关的国际标准
ISO/IEC 21838-1:2021 Information technology Top-level ontologies (TLO)
ISO/IEC 21972:2020 Information technology Upper level ontology for smart city indicators
ISO 19150-4-2019 地理信息.本体论.第4部分:服务本体论
在OPCUA ,DEXPI ,等标准中都提到了本体的概念。
小结
实现 工业4.0 并非易事,数字化道路上有许多绕不过去的坎。本体数据库,知识库就是其中之一。而且我们视乎并没有寻找到合适的商业化或者学术性动机来填补这些技术鸿沟。