IEEE Proc.|基于知识图谱的少样本和零样本学习综述

news2024/11/14 19:14:24

本文作者:陈矫彦(曼彻斯特大学&牛津大学)、耿玉霞(浙江大学)、陈卓(浙江大学)、Jeff Z. Pan(爱丁堡大学)、何源(牛津大学)、 Ian Horrocks(牛津大学)、陈华钧(浙江大学)

发表期刊:Proceedings of the IEEE 2023

论文题目:Zero-Shot and Few-Shot Learning With Knowledge Graphs: A Comprehensive Survey

论文链接:https://ieeexplore.ieee.org/abstract/document/10144560

ArXiv 链接:https://arxiv.org/abs/2112.10006

引言

随着人工智能的飞速发展,机器学习,特别是深度学习,在过去几十年中在许多领域和应用中取得了显著的成就。例如,卷积神经网络(CNN)在图像分类和视觉对象识别方面的准确性常常超过人类,推动了自动驾驶车辆、面部识别、手写识别、图像检索和遥感图像处理等应用的快速发展。同样,循环神经网络(RNN)和基于Transformer的模型在序列学习和自然语言理解方面取得了成功,这些技术推动了机器翻译、语音识别和聊天机器人等应用的发展。然而,大多数机器学习模型的高性能依赖于大量的标记样本进行(半)监督学习,而这些标记样本在现实世界应用中往往成本高昂或不够有效。 在这种背景下,零样本学习(ZSL)和少样本学习(FSL)这两种主要的样本短缺设置备受关注。ZSL被定义为预测在训练中从未出现过的新类别(标签),这些新类别被称为未见类别,而在训练中有样本的类别被称为已见类别。与此相对的,FSL旨在预测那些只有少量标记样本的新类别。零样本学习在过去十年里引起了广泛的关注,提出了许多解决方案。例如,在零样本图像分类中,已经通过CNN从已见类别的图像中学习到的图像特征通常直接被用来为未见类别构建分类器。零样本学习方法通常利用描述类别间关系的辅助信息,如对象的视觉特征(也称为类属性)等。近五年来,知识图谱(KG)作为结构化知识(例如资源描述框架(RDF)三元组)的一种广泛使用的表示形式,引起了广泛的关注,一些基于知识图谱增强的零样本学习方法甚至在许多任务中达到了最先进的性能​​。 本文回顾了这些研究领域的90多篇文章,介绍了ZSL和FSL中使用的知识图谱及其构建方法,并系统地归类和总结了知识图谱感知的ZSL和FSL方法,将它们分为不同的范式,如基于映射、数据增强、基于传播和基于优化等。此外,本文还介绍了不同的应用领域,包括但不限于图像分类、问题回答、文本分类、知识提取,以及知识图谱补全任务等,最终探讨了不同视角下的挑战和未来的研究方向​​。

动机和贡献

  • 样本短缺挑战: 大多数高性能机器学习模型都依赖大量标记样本。然而,在实际应用中收集这些样本成本高昂且效率不高。当出现新的预测目标时,从头开始重新训练复杂模型在许多情境中是不可接受的,这些情况导致了机器学习中的样本短缺问题。

  • 知识图谱(KG)的应用: 针对样本短缺的问题,许多研究开始利用辅助信息,包括知识图谱形式的信息,以减少对标记样本的依赖。

  • 综述文章的贡献: 本文综合回顾了超过90篇关于知识图谱感知研究的文章,专注于两种主要的样本短缺情境——零样本学习和少样本学习。

  • 系统分类和总结: 文章首先介绍了ZSL和FSL中使用的知识图谱及其构建方法,然后系统地分类和总结了知识图谱感知的ZSL和FSL方法,这些方法被分为不同的范式,如基于映射、数据增强、基于传播和基于优化等。

  • 应用领域的展示: 展示了不同的应用领域,包括图像分类、问题回答、文本分类、知识提取以及知识图谱补全任务等,并讨论了不同视角下的挑战和未来的研究方向​​。

零样本学习(ZSL)和少样本学习(FSL)的背景

ZSL的定义和应用领域

  • 应用范围: ZSL被广泛应用于从图像分类和视觉问答(VQA)到文本分类、知识提取和知识图谱补全等不同任务​​。

  • 监督式机器学习分类定义: 在监督式机器学习分类中,训练数据集 $D_{tr}$ 用于训练分类器,从而在测试集 $D_{te}$ 上准确预测标签。

  • ZSL的正式定义: ZSL旨在使用训练样本集 $D_{tr}$ 训练函数 $f$ 来预测测试集 $D_{te}$ 上的样本,其中测试样本的类别 $Y_u$ 与训练样本的类别 $Y_s$ 不相交,即 $Y_u \cap Y_s = \emptyset$​​。

  • 辅助信息的使用: 由于未见类别没有标记样本,ZSL方法依赖于辅助信息,如类属性、类文本描述和类层次结构。

ZSL的发展和辅助信息

  • 早期ZSL方法: 最初提出的ZSL方法主要使用类属性来描述对象的视觉特征。

  • 文本信息的使用: 从2013年起,类的文本信息(从类名到描述类的句子和文档)开始在ZSL中获得广泛关注。

  • 辅助信息的优缺点: 类属性信息易于使用且准确度高,但不能表达某些任务的复杂语义且通常需要人工标注;而类的文本信息易于获取,但可能包含不相关的噪音。

FSL的发展

  • FSL定义: FSL旨在预测那些只有少量标记样本的新类别,这些类别的数量较小,不足以独立训练出稳健的模型。 知识转移的关键挑战: 对于FSL,关键挑战是选择合适的知识进行转移并适应性地结合这些转移的知识以解决新的预测任务。

知识图谱(KG)的背景

定义和范围

  • 定义: 知识图谱(KG)被定义为一个由实体集合 $E$、属性集合 $P$、实体文本集合 $L$ 和陈述集合 $T$ 组成的结构,其中每个RDF三元组 $T$ 表示为 $(s,p,o)$,即主体 $s$(实体),谓词 $p$(属性),客体 $o$(实体或实体文本)。

  • 广泛应用: KG在搜索引擎、推荐系统、临床人工智能和个人助理等许多应用中取得了巨大成功​​。

通用目的的KGs

  • WordNet: 一个大型词汇数据库,包含各种词汇间的关系,如同义词、上下义词等,广泛用于构建特定任务的类层次结构,尤其在图像分类中。

  • ConceptNet: 一个包含常识知识的免费可用语义网络,用于增强ZSL和FSL。

  • Freebase: 一个大型KG,由多个来源贡献的关系事实组成,主要应用于开放信息提取。

  • Wikidata: 一个快速增长的协作编辑KG,用于增强ZSL和FSL。

  • DBpedia: 一个主要从Wikipedia获取知识的大型通用KG,提供层次结构概念和其他模式知识。

  • NELL: 一个从网络持续提取的流行KG,用于增强ZSL和FSL。

  • WebChild: 一个从网络提取的常识知识集合,虽然在ZSL和FSL中使用较少,但在某些应用中被用作辅助KG​​。

ZSL和FSL的KG构建

  • 特定任务的KG构建: 对于ZSL或FSL任务,有时可以直接应用现有KG,但大多数情况下需要提取或构建适应特定任务的KG。

  • 子KG提取: 通过将ML类别与KG实体匹配,然后提取匹配的实体及其相关知识来构建子KG。

  • 任务导向的KG构建: 构建特定任务的KG,例如通过使用类别的文本信息来挖掘类别间关系。

  • 知识整合: 通过整合不同KG或其他资源中提取的知识来构建高质量的任务特定KG​​。

综上所述,知识图谱在ZSL和FSL中的应用不仅仅局限于作为辅助信息的来源,还包括作为解决特定预测任务的关键工具。这些应用展示了KG在不同领域中的广泛适用性和灵活性。

知识图谱驱动的零样本学习(KG-aware ZSL)

基于映射的范式 (Mapping-Based Paradigm)

  • 目标: 构建将输入或类别映射到相同空间的映射函数,使得经过映射后的向量表示可以比较(例如,如果输入的向量与类别向量在某种度量如余弦相似度或欧几里得距离上接近,则输入属于该类别)。

  • 映射函数: 映射函数分为输入映射和类别映射。这些映射可以是线性的也可以是非线性的转换网络,通常从训练数据学习而来。

基于数据增强的范式 (Data Augmentation Paradigm)

  • 使用数据增强: 通过增加训练样本或其表示来提高ZSL性能。这包括通过生成合成样本或使用半监督学习方法来增加数据量。

  • 增强类型: 增强可以是真实数据的变体或通过算法生成的新数据。

基于传播的范式 (Propagation-Based Paradigm)

  • 信息传播: 利用KG中的关系来传播信息,帮助学习过程了解未见类别。

  • 应用方式: 通过在KG上使用图神经网络或其他图基础算法来实现类别间的信息传播。

基于类别特征的范式 (Class Feature Paradigm)

  • 特征提取: 专注于提取和利用类别特征来改善对未见类别的理解和预测。

  • 特征类型: 这些特征可能是从KG中提取的类别属性、文本描述或其他与类别相关的信息。

知识图谱驱动的少样本学习(KG-aware FSL)

基于映射的范式 (Mapping-Based Paradigm)

  • 目标: 构建映射函数,将输入和/或类别映射到同一空间,使其向量表示可比较。

  • 映射函数: 输入映射和类别映射, 可以是线性或非线性转换网络,通常从训练数据学习得到。

基于数据增强的范式 (Data Augmentation Paradigm)

  • 使用数据增强: 通过生成新的数据或样本特征来解决样本短缺问题,将问题转化为标准的监督学习问题。

  • 增强类型: 可以是基于规则的或基于生成模型的,利用任务的背景知识。

基于传播的范式 (Propagation-Based Paradigm)

  • 信息传播: 利用KG中的关系来传播信息,帮助学习过程理解未见类别。

  • 应用方式: 使用图神经网络或其他图基础算法在KG上实现类别间的信息传播。

基于类别特征的范式 (Class Feature Paradigm)

  • 特征提取: 专注于提取和利用类别特征来改善对未见类别的理解和预测。

  • 特征类型: 这些特征可能是从KG中提取的类别属性、文本描述或其他与类别相关的信息。

基于优化的范式 (Optimization-Based Paradigm)

  • 优化目标: 在学习过程中优化特定的目标函数,以提高对未见类别的预测精度。

  • 应用方法: 使用优化算法来调整模型参数,提高学习效率和预测性能。

基于迁移学习的范式 (Transfer-Based Paradigm)

  • 知识转移: 利用已见类别上学习到的知识来帮助理解和预测未见类别。

  • 转移策略: 包括特征转移、模型参数转移等,以实现跨类别的学习。

ZSL和FSL比较

  • 共同点与差异: 分析和比较ZSL和FSL在方法、应用和性能上的共同点和差异。

  • 综合评估: 对两种学习策略的优势和局限性进行综合评估。

应用方向和数据集(Applications & Resources)

计算机视觉 (Computer Vision)

  • 多样化应用: 在计算机视觉领域,KG-aware ZSL和FSL被应用于图像分类、目标识别等任务。

  • 数据集: 使用了如ImageNet、AwA2等标准图像数据集,以及特定于任务的数据集。

自然语言处理 (Natural Language Processing)

  • 文本分类和问答: 在NLP领域,KG-aware ZSL和FSL用于文本分类、实体提取、关系提取、问答系统等。

  • 数据集: 使用了如TREC QA、WikiQA等问答数据集和特定于任务的文本数据集。

知识图谱补全 (KG Completion)

  • 关系预测: 应用于预测知识图谱中的缺失关系,如实体关系预测。

  • 数据集: 使用了如NELL、Wikidata等知识图谱数据集。

KG质量 (KG Quality)

  • 数据质量问题: 讨论了知识图谱中数据质量问题,如不完整性、不一致性等。

  • 提高质量: 探讨了如何通过各种技术提高KG的质量和可靠性。

学习范式 (Learning Paradigms)

  • 多样性: 分析了各种KG-aware学习范式,包括映射、传播、数据增强等。

  • 改进方法: 探讨了如何改进这些范式以提高ZSL和FSL的性能。

ZSL和FSL在KG构建中的应用 (ZSL and FSL in KG Construction)

  • 构建方法: 探讨了如何利用ZSL和FSL来构建和改进知识图谱。

  • 实用案例: 分析了实际案例,如如何在特定领域(如医学)构建和使用知识图谱。

基准测试 (Benchmarking)

  • 性能评估: 讨论了如何评估和比较不同的ZSL和FSL方法。

  • 基准数据集: 强调了使用标准和可比较的基准数据集的重要性​​。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1429977.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux的权限 + 【提权 | 粘滞位】

Linux权限的概念 Linux下有两种用户:超级用户(root)、普通用户。 超级用户:可以在linux系统下做任何事情,不受限制普通用户:在linux下做有限的事情。超级用户的命令提示符是“#”,普通用户的命…

C++迷宫游戏详解

个人主页:[PingdiGuo_guo] 收录专栏:[C干货专栏] 大家好呀,我是PingdiGuo_guo,今天我们来学习用C实现一个迷宫游戏。 目录 1.迷宫的具体步骤 1.1.迷宫的初始化 1.2.寻路算法 1.DFS算法 2.BFS算法 1.3.移动 2.总结 C迷宫游…

音视频数字化(数字与模拟-录音机)

之前我们说了【数字与模拟-照相机】照相机的数字化,今天聊聊录音机。 说录音机之前,必须说说留声机。留声机是爱迪生1877年宣布发明成功的,研发过程相当复杂,但原理是简单的。 声音的本质是“波”,是物体振动产生的。以乐器为例,打击乐就是敲击(鼓、钹、木鱼、木琴、三…

向刻苦耐劳乐观向上的青年致敬

今晨互联网上的国际时事新闻报道,显得越来越真假难辨;特别是对俄乌战争、以巴战争、中美俄日朝印越和欧盟各国关系的新闻报道,可谓朝三暮四,一日多变,令人不知谁家的报道可信,便绕道行,不议为妙…

ES6-对象的解构赋值

一、区别一下数组的解构赋值 - 对象的解构与数组有一个重要的不同。数组的元素是按次序排列的,变量的取值由它的位置决定;而对象的属性没有次序,变量必须与属性同名,才能取到正确的值二、说明 - 对象的解构赋值的内部机制&#…

XML详解

文章目录 XML简介语法约束DTDSchema 解析Jsoup使用对象详解JsoupDocumentElementsElementNode XML 简介 概述:Extensible Markup Language 可扩展标记语言 可扩展:标签都是自定义的。 功能 数据存储:XML 可以用来存储结构化数据&#xff0c…

mysql-FIND_IN_SET查询优化

优化前 SELECTuser_id,user_name,real_name,PASSWORD,real_org_id,real_org_name,real_dept_id,real_dept_name, STATUS FROMsys_user WHEREis_del 0 AND find_in_set( lilong, login_user_account ) 优化后 SELECTuser_id,user_name,real_name,PASSWORD,real_org_id,real…

虚拟机Windows Server 2016 安装 MySQL8

目录 一、下载MySQL8 1.下载地址: 2.创建my.ini文件 二、安装步骤 第一步:命令窗口 第二步:切换目录 第三步:安装服务 第四步:生成临时密码 第五步:启动服务 第六步: 修改密码 三…

《A++ 敏捷开发》- 6 估算软件规模

为什么要估规模 规模可以帮我们: 依据历史数据策划,例如估算工作量、工期。归一(Normalize)不同项目作比较。知道现在水平。 依据历史数据策划先把项目分成组件,参考以往类似的组件所花工作量,估算整个项目的总工作量。规模大小…

时间回显+选择(年月日时分秒

一、获取某个时间 1、Date获取Date类型 <el-form-item label"时间" name"endTime"><el-date-picker type"datetime" v-model"editForm.endTime"></el-date-picker> </el-form-item> 效果如图&#xff1a; …

关于爬取所有哔哩哔哩、任意图片、所有音乐、的python脚本语言-Edge浏览器插件 全是干货!

这些都是现成的并且实时更新的&#xff01;从次解放双手&#xff01; 首先有自己的edge浏览器基本上都有并且找到插件选项 1.哔哩哔哩视频下载助手&#xff08;爬取哔哩哔哩视频&#xff09; bilibili哔哩哔哩视频下载助手 - Microsoft Edge Addons 下面是效果&#xff1a; 2.图…

办公软件巨头CCED、WPS面临新考验,新款办公软件异军突起

办公软件巨头CCED、WPS的成长经历 众所周知&#xff0c;CCED和WPS在中国办公软件领域树立了两大知名品牌的地位。然而&#xff0c;它们的成功并非一朝一夕的成就&#xff0c;而是历经了长时间的发展与积淀。 在上世纪80年代末至90年代初&#xff0c;CCED作为中国大陆早期的一款…

Python爬虫http基本原理

Python爬虫逆向系列&#xff08;更新中&#xff09;&#xff1a;http://t.csdnimg.cn/5gvI3 HTTP 基本原理 在本节中&#xff0c;我们会详细了解 HTTP 的基本原理&#xff0c;了解在浏览器中敲入 URL 到获取网页内容之间发生了什么。了解了这些内容&#xff0c;有助于我们进一…

python爬虫爬取网站

流程&#xff1a; 1.指定url(获取网页的内容) 爬虫会向指定的URL发送HTTP请求&#xff0c;获取网页的HTML代码&#xff0c;然后解析HTML代码&#xff0c;提取出需要的信息&#xff0c;如文本、图片、链接等。爬虫请求URL的过程中&#xff0c;还可以设置请求头、请求参数、请求…

亿某通电子文档安全管理系统 UploadFileToCatalog SQL注入漏洞

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…

用免费软件分流抢票Bypass辅助购买火车票的亲测可用方法

本文介绍基于分流抢票&#xff08;Bypass&#xff09;软件&#xff0c;协助购买预售、已开售或候补等各类状态的火车票的方法。 最近几天一直没有顾得上看过年回家的火车票&#xff0c;导致错过了回家车票的开售时间&#xff0c;所以当时就直接去12306的官方网站候补了&#xf…

基于3DGIS 的5G 基站规划

这个基于3DGIS 5G 基站规划的案例很不错&#xff0c;与大家分享一下。感觉是3DGIS中为数不多的实用案例。但还是没有特别多的突出三维的技术优势&#xff0c;因为这里面很多规划思想其实还是基于面的而不是基于体的&#xff01;好了不多说了&#xff0c;给大家分享这个案例&…

java hutool工具类实现将数据下载到excel

通过hutool工具类&#xff0c;对于excel的操作变得非常简单&#xff0c;上篇介绍的是excel的上传&#xff0c;对excel的操作&#xff0c;核心代码只有一行。本篇的excel的下载&#xff0c;核心数据也不超过两行&#xff0c;简洁方便&#xff0c;特别适合当下的低代码操作。 下载…

【Java程序设计】【C00188】基于SSM的宠物猫狗商业管理系统(论文+PPT)

基于SSM的宠物猫狗商业管理系统&#xff08;论文PPT&#xff09; 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于ssm的宠物猫狗商业系统 本系统分为前台系统、后台管理员以及后台用户3个功能模块。 前台系统&#xff1a;当游客打开系统的网址后&#xff0c;…