【机器学习】机器学习中的“本体”概念

news2024/9/25 9:46:36

一、说明

        在机器学习中,本体越来越多地用于提供基于相似性分析和场景知识的 ML 模型。

        在传统的基于标签的定义中,对象往往是孤立的,可扩展性差,存在重复的可能性,对象之间的关系无法体现。在基于本体的定义中,对象不再孤立存在,场景搜索、本体融合、本体推荐等功能也可以通过关系标注来实现。

        本体首先由世界上第一个开源多感官训练数据平台Xtreme1引入,用于从各种模型需求中抽象出AI问题的定义。它可以复用和扩展,以构建AI算法的知识库,从而加速模型开发。

二、什么是本体?

        本体论是一种描述世界上一切事物的结构化方式,包括三个要素:

        类 — 表示表示实例的类型、标签或抽象类;

        关系 ― 表示描述之间的关系,可以是有向图或无向图。例如,在自动驾驶场景中,汽车可能有“平行”、“超车”等。关系;

        属性 ― 表示节点或关系的属性。例如,“汽车”的属性可能包括“颜色”、“车窗打开/关闭”等,而“行人”的属性可能包括他们的“性别”或“口罩开/关”。

类、关系和属性

        自动驾驶是人工智能公司和汽车行业最具前途和最具挑战性的研究课题之一。目前,主流自动驾驶汽车都配备了一些高灵敏度的传感器,如摄像头、激光雷达和雷达设备。尽管这些传感器可能已经能够准确识别特定物体,例如汽车或禁止转弯的交通标志,但如果不全面了解数据场景,车辆就无法理解驾驶环境的含义。因此,需要一种机器友好的知识表示方法来弥合感知驾驶环境和处理知识之间的差距。

三、本体在数据管理中的作用是什么?

        在本体中心定义类和属性后,用户可以轻松搜索“Chage Lane”等场景。本体中心还可以根据类、属性和关系之间的规则推断出新的注释。随着本体数据量的增加,本体中心还可以推荐不同领域中性能更好的本体模型。

3.1 场景搜索

方案搜索解决了如何定义和查找特定方案中出现的数据的问题。

传统上,当我们通过标签层次结构定义数据来管理数据时,会出现一个问题,即数据标签过于笼统,无法查明数据场景中的特定问题。同时,在传统的基于标签的定义中,对象过于孤立,无法避免重复或显示与其他对象的连接。

方案搜索功能通过类和属性定义对象,通过对象之间的关系和属性定义方案。很容易定义和查找变道、停车、转弯和跑道入侵等场景。

变道场景

3.2 本体论推理

        在注释和质量控制中,可以根据属性、类和关系之间的规则推断出新的标记结果或有问题的注释。例如,在自动驾驶场景中,红灯、绿灯和黄灯属于同一个红绿灯。如果红灯的状态是“亮”,那么可以推断绿灯和黄灯肯定没有亮起。如果红灯和绿灯都标记为“开”,则标记结果可能会出现问题。

3.3 本体消歧

        在注释中,在同一数据批中遇到不同的定义是很常见的。本体融合可以帮助用户解决这些不一致的问题。

3.4 本体推荐

        在开源 Xtreme1 的 SaaS 版本中,当数据累积到 PB 级时,可以为各个领域的常见模型需求提供更高性能的本体模型,以促进定制解决方案。

安全自动驾驶的核心本体

四、Xtreme1 v0.5.5 的亮点:

        ·新本体中心旨在对本体和数据进行跨数据集管理,并基于场景完善行业模板和解决方案进行模型训练;

·本体中心中CRUD本体的分类和分类;

·数据集中的类与本体中心中的类之间的本体融合;

·在本体中心和数据集中导出和导入本体;

·从本体中心复制类和/或分类;

·数据集和本体中类的推送/拉取;

·跨数据集搜索相同数据类型的方案;

·将搜索结果导出为 JSON 文件或新数据集。

Xtreme1 未来版本中的计划功能包括:

·注释关系并按类和场景进行搜索;

·按类、关系和/或属性进行属性搜索(在方案搜索中)。

网站 |Xtreme1.io

文档 |docs.xtreme1.io

GitHub 存储库 |github.com/xtreme1.io/xtreme1

松弛 |xtreme1io.slack.com

五、参考:

        安全自动驾驶的核心本体:https://ceur-ws.org/Vol-1486/paper_9.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/796647.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

​语言模型输出端共享Embedding的重新探索

©PaperWeekly 原创 作者 | 苏剑林 单位 | 科学空间 研究方向 | NLP、神经网络 预训练刚兴起时,在语言模型的输出端重用 Embedding 权重是很常见的操作,比如 BERT、第一版的 T5、早期的 GPT,都使用了这个操作,这是因为当模型…

每天一个电商API分享:获取淘宝商品sku接口

SKU通俗来讲就是一个产品最小的出库单位,比如说一款手机产品有红黑白三个颜色,那么一台红色手机就是一个sku。那么多销售属性的产品,再往下分,比如说一件T恤除了有颜色还有尺码,那么一件s码绿色体恤就是单个sku。 sku指…

数据学习教程:Linux基础教程(下)

本文继上一篇《Linux基础教程(上)》的下一篇,欢迎收藏。 4 Linux常用基础命令 Linux刚面世时并没有图形界面, 所有的操作全靠命令完成, 如磁盘操作、文件存取、目录操作、进程管理、文件权限设定等 在职场中,大量的服务器维护工作…

C盘满了怎么清理?最全c盘清理攻略!

“c盘怎么会那么容易满啊?而且每次清理好像也释放不了多少空间。谁懂啊?一天要清理好几次c盘!真的很麻烦。有谁能告诉我应该怎么做吗!” 电脑c盘对我们来说真的是很重要。当我们在电脑上安装软件、存储文件或者浏览网站&#xff0…

提升打印品质:解决Excel表格乱套问题的实用技巧

作为办公人员,我们经常需要打印大量的数据表格。然而,打印表格并不是一件简单的事情,如果不注意,打印效果可能会变得混乱不堪。那么该怎么办呢?在这里,我将为大家分享9个关于Excel表格打印的技巧&#xff0…

django自定义app,创建子应用

1.工程里创建apps包 ; 2.创建子应用,pycharm terminal 运行:python ./nanage.py startapp app名称; 3.子应用移动到apps包里; 4.settings.py里设置INSTALLED_APPS如“apps.users”,该名字跟子应用apps.py文…

KBYCMS框架后台使用帮助介绍

后台入口文件 后台入口文件默认是public目录下的admin.php。访问后台时加上admin.php访问,您可根据需要,重命名后台入口文件。 重命名后需要在config/app.php文件中修改配置,配置如下,如果没有以下配置那么该版本无需理会。 // 入口文件绑定,无需写index app_file …

Fastjson远程命令执行漏洞总结

## 1.FastJson 简介 ##### fastjson.jar包原始下载地址:https://github.com/alibaba/fastjson ##### fastjson用于将Java Bean序列化为JSON字符串,也可以从JSON字符串反序列化到JavaBea... 1.FastJson 简介 fastjson.jar包原始下载地址:Git…

设计模式-模版方法模式

生活中处处存在模版,模版定义了大的框架,具体内容由使用者填充即可,这给很多人的生活、工作带来了很大的遍历。比如: PPT模版:好的PPT模版提供了更全面的叙述框架,更优美的UI画面&图标,提升…

算法训练营第五十一天||309.最佳买卖股票时机含冷冻期 ● 714.买卖股票的最佳时机含手续费 ●总结

309.最佳买卖股票时机含冷冻期 这道题主要就是搞懂dp数组含义以及状态之间的转换&#xff0c;没看答案能自己做出来 class Solution { public:int maxProfit(vector<int>& prices) {vector<vector<int>> dp(prices.size(),vector<int>(5,0));//前…

jMeter使用随记

参数化BodyData 先制作参数文件 再设置一个csv data set config 最后在body data里面写上参数${xxxxx}

【外卖系统】更新员工信息

需求分析 员工管理列表界面&#xff0c;需要对某个员工的账号进行启用和禁用操作。账号禁用的员工不能登录系统&#xff0c;启用后的员工可以正常登录。只有admin可以对其他普通用户进行启用、禁用的操作&#xff0c;普通用户登录系统后启动、禁用按钮都是不显示的编辑员工信息…

家庭有必要买洗地机吗、洗地机排行榜推荐

洗地机相信大家都认识吧&#xff0c;在清洁家电领域这可谓是个“名人”。在清洁工具的名单中&#xff0c;要说一机多用&#xff0c;使用体验好的&#xff0c;洗地机绝对名列前茅。和传统清洁工具相比&#xff0c;洗地机可以很快速的就清洁干净地面&#xff0c;十多分钟就能还你…

数据库—用户权限管理(三十三)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 目录 前言 一、概述 二、用户权限类型 ​三、用户赋权 四、权限删除 五、用户删除 前言 数据库用户权限管理是指对数据库用户的权限进行控制和管理&#xff0c;确保用户只能执…

探究Spring Bean的六种作用域:了解适用场景和使用方式

这里写目录标题 单例&#xff08;Singleton&#xff09;作用域&#xff1a;原型&#xff08;Prototype&#xff09;作用域&#xff1a;请求&#xff08;Request&#xff09;作用域&#xff1a;会话&#xff08;Session&#xff09;作用域&#xff1a;全局&#xff08;applicati…

【一文搞懂】—带霍尔编码器的直流有刷减速电机

文章目录 一、直流有刷电机二、减速比三、霍尔编码器3.1 霍尔编码器3.2 霍尔编码器测速原理 四、测速程序设计4.1 跳变沿检测4.2 计算转速 一、直流有刷电机 宏观上说直流有刷电机由固定部分&#xff08;定子&#xff09;和旋转部分&#xff08;转子&#xff09;组成。在定子上…

Web Worker的概念、用法、使用场景

​ 目录 1. 简介 2. 适用场景 2.1 复杂计算 2.2 后台下载 2.3 数据处理 2.4 实时通信 3. 代码示例 3.1 Worker特性检测 3.2 Worker API 3.3 SharedWorker API 3.4 创建 JavaScript 文件 3.5 创建 Web Worker 4. 总结 1. 简介 Web Worker 使得在一个独立于 Web 应…

2023-07-27 LeetCode每日一题(删除每行中的最大值)

2023-07-27每日一题 一、题目编号 2500. 删除每行中的最大值二、题目链接 点击跳转到题目位置 三、题目描述 给你一个 m x n 大小的矩阵 grid &#xff0c;由若干正整数组成。 执行下述操作&#xff0c;直到 grid 变为空矩阵&#xff1a; 从每一行删除值最大的元素。如果…

VS2022和QT混合编程打包发布程序

1.在开始菜单输入 CMD 找到 Qt5.15.2(MSVC 64-bit) 2.输入windeployqt exe所在路径 3.运行完毕后&#xff0c;双击打开exe文件&#xff0c;可能会报错&#xff0c;缺少相关的dll,找到缺少的dll拷贝到运行文件夹下即可。

数字化管理能给企业带来哪些好处?

企业数字化管理&#xff08;EDM&#xff09;是指使用数字技术和工具来管理企业运营和流程的各个方面。如果有效实施&#xff0c;EDM 可以给企业带来多种好处&#xff0c;提高企业的整体效率、生产力和竞争力。以下是一些主要优点&#xff1a; 1.提高效率&#xff1a;EDM 通过自…