跨域推荐(Cross-Domain Recommendation)的最新综述

news2024/11/16 1:56:14

论文解读系列第十六篇:IJCAI 2021--跨域推荐(Cross-Domain Recommendation)的最新综述 - 知乎

数据稀疏问题

目录

1.背景介绍

(1)内容层级相关性(content-level relevance)

(2)用户层级相关性(user-level relevance)

(3)产品层级相关性(item-level relevance)

2.综述的动机

3.不同的跨域推荐场景以及挑战

场景1. 单目标跨域推荐(single-target CDR)

场景2. 多领域推荐(Multi-Domain Recommendation)

场景3. 双目标跨域推荐(dual-target CDR)

​场景4. 多目标跨域推荐(Multi-target CDR)

4.相关的研究进展 

5.可用数据集合

​6.未来研究方向 

7.结论

8.参考文献​​​​​​​


1.背景介绍

        在大多数的推荐应用场景,很少有用户给大量的产品反馈信息,例如点赞、评分、评论等等。在推荐系统里,这样的反馈信息匮乏现象被称为数据稀疏问题。几乎所有的推荐系统,尤其是基于协同过滤技术(Collaborative Filtering,CF)的推荐系统,都多多少少受到数据稀疏的影响。特别对于新用户或者新产品(Cold-Start,冷启动问题)来说,由于在系统内还没有产生任何的交互信息(评分、评论等等),推荐的精度会比较低。这是因为,在训练基于CF思想的推荐模型时,稀疏的训练数据往往会造成过拟合问题。跨域推荐的提出就是为了解决这个数据稀疏问题。基本思路是利用丰富领域(richer domain又称为source domain)的较为丰富训练数据来提升稀疏领域(sparser domain又称为target domain)的推荐精度。

        要想清楚理解跨域问题,首先先理清领域(domain)的定义,因为这个定义在很多的CDR相关文献中都比较模糊。例如,有些文献中以不同的产品(例如电影和图书)来划分领域而有些文献则以产品的细分属性(例如教科书和小说)来划分领域。因此,综述首先根据三种不同层级的相关性,给出了“领域”的具体定义:

(1)内容层级相关性(content-level relevance)

        两个或多个领域中,用户之间产品之间存在共同的内容或者特征(例如关键字、标签)。但是这些领域不存在共同的用户或者产品。例如:亚马逊音乐(Amazon music,音乐相关)和奈飞(Netflix,电影相关)。

(2)用户层级相关性(user-level relevance)

        两个或多个领域中,存在共同用户但是产品层级不同。产品层级的不同又可以细分为属性层级(attribute-level)的不同(即类型相同(例如图书)但是属性不同,例如教科书、小说、自传等等)和类型层级(type-level)的不同(例如图书、电影、音乐、服装等等)。

(3)产品层级相关性(item-level relevance)

        两个或多个领域中,存在共同产品但是用户不同。例如:MovieLens和奈飞,都是电影相关的系统,存在大量相同的电影,但是用户不同,或者很难识别用户一致性。这种类型在一些文献里又被称为cross-system recommendation(跨系统推荐)

        实质上,“领域”的不同定义是根据两个域的不同重叠部分(overlap)来区分的。理解清楚“领域”的定义,对接下来了解现有跨域推荐方法或者未来趋势有很大的帮助。

2.综述的动机

        实际上,跨域推荐不是一个新的研究课题。从2007年,Shlomo Berkovsky 等人第一次提出“跨域推荐”这个概念开始,已经有了四篇相关的综述文章(具体见综述原文)。然而,近些年来,在跨域推荐领域出现了一些新的或愈发明显的挑战,例如特征映射问题、嵌入(embedding)优化问题以及负面迁移问题(negative transfer)。另外,随着应用场景的拓展,跨域推荐也出现了一些新的方向,例如双目标跨域推荐(dual-target CDR)多目标跨域推荐(multi-target CDR)。这些新的挑战以及新的研究方向,促使综述作者们整理出了这篇新的综述论文。

3.不同的跨域推荐场景以及挑战

场景1. 单目标跨域推荐(single-target CDR)

        传统的跨域推荐主要是针对的单目标跨域推荐(single-target CDR),即利用丰富领域(源领域,source domain)来提升稀疏领域(目标领域,target domain)的推荐精度。根据上面“领域”的不同定义,单目标跨域推荐可以细分为以下三个应用场景:

        这个场景下,研究人员将面临如下三个挑战

(1)构建基于内容的关系;

(2)生成准确的用户/产品嵌入表达(embeddings)或者评价模式(rating patterns);

(3)学习准确的映射关系:领域之间embeddings或rating pattern的迁移对应关系。

场景2. 多领域推荐(Multi-Domain Recommendation)

        在单目标跨域推荐中,有一个研究分支,即多领域推荐(Multi-Domain Recommendation)。这个分支主要针对来之多个领域的特定用户集中用户,推荐来之多个领域的特定产品,本质上这也是single-target CDR,因为推荐的目标是特定一个集合(用户集合)。因此,本综述认为这个研究方向还是single-target CDR的一个分支。

场景3. 双目标跨域推荐(dual-target CDR)

        这是一个新的跨域推荐场景,即同时利用两个领域的数据来同时提升两个领域的推荐精度。这个场景面临以下两个新的挑战:

(1)构建一个可行的双目标跨域推荐的框架;

(2)各领域之间的对应关系,优化用户/产品的嵌入表达(embeddings)。

场景4. 多目标跨域推荐(Multi-target CDR)

        这也是一个新的跨域推荐场景,即同时利用多个领域的数据来同时提升多个领域的推荐精度。这个场景面临以下挑战:避免负面迁移(negative transfer),这个问题随着越来越多领域的加入会愈加严重。

4.相关的研究进展 

现有的跨域推荐方法主要划分如下图:

现有方法针对的推荐场景、挑战以及它们利用的数据类型、技术理念,请见综述原文。 

5.可用数据集合

综述中整理了一些跨域推荐可用的数据集合:

6.未来研究方向 

        根据前文总结的不同推荐场景、挑战以及已经取得的成果,综述给出了三个未来值得研究方向以供参考:

(1)异质化跨域推荐:现有跨域推荐的假设前提是跨域的信息是同质的,但是实际应用场景中,存在跨域的异质信息。

(2)序列化跨域推荐:跨域推荐系统也和传统推荐系统一样,面临如何序列化地给用户/产品建模。

(3)隐私保护的跨域推荐:现有的跨域推荐方法忽略了信息孤岛的问题。而实际应用场景,用户敏感信息是无法直接跨域分享的。

        另外,数据集稀疏程度、领域间的重叠规模(overlap scale)、以及领域间的关联度,如何分别影响跨域推荐的性能?这些问题同样也值得进一步研究。

7.结论

        近些年,随着深度神经网络以及图学习的发展,跨域推荐越来越受工业界、学术界的关注。本篇综述分别从单目标跨域推荐、多领域推荐、双目标跨域推荐、以及多目标跨域推荐来系统性地分析、总结现有跨域推荐方法。综述的最后,给出了三个未来值得研究方向以供读者参考,并希望这些方向能得到进一步的研究,最终解决困恼推荐领域多年的问题——数据稀疏问题。

8.参考文献

        [原文]. Feng Zhu, Yan Wang, Chaochao Chen, Jun Zhou, Longfei Li and Guanfeng Liu. Cross-Domain Recommendation: Challenges, Progress, and Prospects. IJCAI 2021 Survey Track.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/64031.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenCV从2到3的过渡

与版本2.4相比,OpenCV 3.0引入了许多新算法和功能。有些模块已被重写,有些已经重组。尽管2.4中的大多数算法仍然存在,但接口可能不同。本节描述了一般性的最显着变化,过渡操作的所有细节和示例都在本文档的下一部分中。 1、贡献存…

nginx安装与配置反向代理

Nginx (engine x) 是一款基于异步框架的轻量级/高性能的Web 服务器/反向代理服务器/缓存服务器/电子邮件(IMAP/POP3)代理服务器,由俄罗斯的程序设计师Igor Sysoev(伊戈尔赛索耶夫)所开发.话不多说直接上步骤 1.安装nginx,我是在root用户下不需要加sudo yum install nginx 安…

嵌入式分享合集116

一、DC-DC升压电路模块原理 DC-DC 转换器是一种电力电子电路,可有效地将直流电从一个电压转换为另一个电压。 DC-DC 转换器在现代电子产品中扮演着不可或缺的角色。这是因为与线性稳压器相比,它们具有多项优势。尤其是线性稳压器会散发大量热量&#x…

什么是天气预报 API 接口?如何获取天气预报 API?

什么是天气预报API接口? 天气的好坏和人们的生活、工作息息相关,每天的天气如何?总是牵动着人们的心,关注天气就行了人们茶余饭后的话题了。如何获得准确的天气预报?还得从天气预报API接口说起。 天气预报API是提供未…

150398-22-4,三肽Phe-Arg-Arg

The tripeptide FRR was found to exert a Zn⁺ dependent, insulin-mimetic inhibitory action on myocardial proteolysis. 三肽FRR对心肌蛋白水解具有Zn⁺依赖性、胰岛素样抑制作用。 编号: 197811中文名称: 三肽Phe-Arg-Arg英文名: Phe-Arg-ArgCAS号: 150398-22-4单字母: H…

yolov1 论文精读 - You Only Look Once

YOLOv1 Introduction 作者将目标检测进行重构并看作为单一的回归问题,直接从图像到边界框坐标和类别概率。使用我们的系统,您只需要在图像上看一次(you only look once, YOLO),以预测出现的目标和位置。 系统将输入…

SpringMVC(九):作用域传参

文章目录 作用域传参 一、传统方式传递数据 二、使用Model传递数据

PHP反序列化与SESSION

php存储session的三种模式php_serialize&#xff08;php>5.5.4&#xff09; 经过serialize()函数序列化数组 php 键名竖线经过seralize()序列处理的值 php_biary 键名的长度对应ASCII字符键名serialize()序列化的值 测试代码 <?php //ini_set("sessi…

cubeIDE开发,在LCD显示摄像头抓取的图片数据

一、摄像头相关资料信息 在LCD上显示当前camera的图像数据&#xff0c;类似我们前面提到的LCD显示图片数据&#xff0c;就是实时将摄像头抓取的视频数据帧&#xff08;图片&#xff09;转换成图片字码表&#xff0c;即LCD宽*LCD高像素大小的颜色点阵&#xff0c;然后推送到LCD接…

(三) Spring Security Oauth2.0 源码分析--认证中心全流程分析

一 引言 Spring Security Oauth2.0 的认证中心可以简单的理解为是对Spring Security的加强,也是通过FilterChainProxy(其原理可参考前面的Security源码分析)对客户端进行校验后在达到自定义token颁发站点,进行token的颁发,具体流程如下: 用户发起token申请请求(‘/oauth/to…

ARM异常处理(4):SVC和PendSV的作用详解

SVC(Supervisor Call)和PendSV(Pendable Service Call)是针对软件和操作系统的两个异常。 1 SVC SVC用于生成系统函数调用&#xff0c;例如&#xff0c;用户程序不允许直接访问硬件&#xff0c;操作系统可以通过SVC提供对硬件的访问。因此&#xff0c;当用户程序想要使用某些…

STC 51单片机56——摇摇棒

主要代码&#xff1a; //增减图像时&#xff0c;需要修改 switch_show&#xff08;&#xff09;和 H对应参数 //所用单片机&#xff1a;STC15W408S 内部Rc 11.0592MHz #include <STC15.H> #include <intrins.h> #define POSITIVE 0 #define OPPOSE 1 //sbi…

Vector-常用CAN工具 - CANoe入门到精通_02

​咱们话接上回&#xff0c;前面已经介绍了CANoe的基本信息和硬件环境搭建&#xff0c;下面我们就要打开CANoe&#xff0c;配置CANoe工程了&#xff0c;只有完成了CANoe工程配置才能真正的使用CANoe完成测试&#xff0c;本次主要介绍的是手工测试环境&#xff0c;至于自动化测试…

[附源码]Python计算机毕业设计SSM教师职称评定系统(程序+LW)

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

【OpenCV学习】第5课:图像模糊(均值滤波,高斯滤波)

参考文章链接:https://blog.csdn.net/qq_30460949/article/details/121990114 仅自学做笔记用,后续有错误会更改 理论 1.Smooth/blur是图像处理中最简单和常用的操作之一 2.使用该操作的原因之一就是为了给图像预处理的时候减低噪声 3.使用Smooth/Blur操作其背后是数学的卷积…

ContentProvider与ContentResolver

目录&#xff1a;一、什么是ContentProvider&#xff1a;二、如何使用ContentProvider&#xff1a;第一步.创建类继承ContentProvider&#xff1a;第二步.注册ContentProvider&#xff1a;三、URI&#xff1a;1.常用方法&#xff1a;2.解析URI&#xff1a;&#xff08;1&#x…

Android Gradle 学习笔记(二)环境安装

1. 官网安装 Gradle 安装地址&#xff1a;Gradle | Installation 最新的 Gradle 版本是 7.6&#xff0c; 需要 Java 8及以上的版本支持&#xff0c;官网有两种版本可下载&#xff1a; 二进制版本完全版本&#xff08;源码 文档&#xff09; 一般情况下&#xff0c;下载二进…

助力企业降本增效,「WorkPlus SE专业版」正式发布!

移动互联网时代&#xff0c;数字化成为了企业提质降本增效的价值路径。大中小型企业积极主动地借助各种在线办公产品&#xff0c;实现沟通协作和运营管理的优化升级。 随着企业规模的扩大和办公业态多样化发展&#xff0c;会面临着业务流程繁杂、数据利用率低、IT成本高、泄密…

RFID警用装备管理系统-公安警用装备管理可视化系统

一、方案背景 我国警用装备物资种类多、数量大、价值高&#xff0c;还包含枪支、弹药、爆炸物等需要重点监管的物资&#xff0c;在公安机关应对紧急情况、处理突发事件过程中发挥了极为重要的作用。但是&#xff0c;由于缺乏有效的信息化管理手段&#xff0c;还存在管理方式落后…

Tealium 分析

文章目录1.0 调用流程1.1 初始化流程1.2 发送数据流程2.0 Tealium 的设计2.1 总体设计2.1.1 Tealium Core2.1.2 Visitor2.1.3 Crash reporter2.1.4 Ad identifler2.1.5 Lifecycle2.1.6 Location2.1.7 InstallReferrer2.1.8 Hosteddatalayer2.1.8 Dispatcher2.2 网络设计2.3 本地…