KDD 2023 获奖论文公布,港中文、港科大等获最佳论文奖

news2025/1/9 17:17:58

ACM SIGKDD(国际数据挖掘与知识发现大会,KDD)是数据挖掘领域历史最悠久、规模最大的国际顶级学术会议,也是首个引入大数据、数据科学、预测分析、众包等概念的会议。

今年,第29届 KDD 大会于上周在美国加州长滩圆满结束,大会包含研究方向(Research)和应用数据科学方向(Applied Data Science,ADS)两个 track,共公布了8篇获奖论文。

KDD最佳论文奖

研究方向

All in One: Multi-task Prompting for Graph Neural Networks

标题:All in One: 多任务提示用于图神经网络

作者:Xiangguo Sun, Hong Cheng, Jia Li, Bo Liu, Jihong Guan

内容:受自然语言处理(NLP)中提示学习的启发,提示学习在利用先验知识进行各种NLP任务方面展示了显著的有效性,我们研究图形提示的主题,目的是填补预训练模型和各种图形任务之间的差距。

在本文中,作者为图形模型提出了一种新的多任务提示方法。具体来说,首先使用提示词、词汇结构和插入模式统一了图形提示和语言提示的格式。通过这种方式,NLP中的提示想法可以无缝地引入图形领域。然后,为了进一步缩小各种图形任务与最先进的预训练策略之间的差距,作者进一步研究了各种图形应用的任务空间,并将下游问题重构为图形级任务。之后,作者引入元学习来有效地学习图形多任务提示的更好初始化。以便提示框架对不同的任务更可靠和通用。经实验,结果证明了该方法的优越性。

应用数据科学方向

Improving Training Stability for Multitask Ranking Models in Recommender Systems

标题:改进推荐系统中多任务排序模型的训练稳定性

作者:Jiaxi Tang, Yoel Drori, Daryl Chang, Maheswaran Sathiamoorthy, Justin Gilmer, Li Wei, Xinyang Yi, Lichan Hong, Ed H. Chi

内容:在本文中,作者分享了对改进YouTube推荐的真实世界多任务排序模型训练稳定性方面的发现和最佳实践,展示了导致模型训练不稳定的一些特性,并猜测原因。此外,根据作者对训练不稳定点附近的训练动态的观察,作者推测为什么现有的解决方案会失败,并提出了一种新的算法来缓解现有解决方案的局限性。在YouTube生产数据集上的实验表明,与几种常用的基线方法相比,所提出的算法可以显着改善训练稳定性而不损害收敛性。

KDD最佳学生论文奖

研究方向

Feature-based Learning for Diverse and Privacy-Preserving Counterfactual Explanations

标题:基于特征的学习方法用于生成多样且保护隐私的反事实解释

作者:Vy Vo, Trung Le, Van Nguyen, He Zhao, Edwin Bonilla, Gholamreza Haffari, Dinh Phung

内容:可解释的机器学习旨在理解长期以来因缺乏可解释性而臭名昭著的复杂黑盒系统的推理过程。一种繁荣的方法是通过反事实解释,它提供了建议,告诉用户可以做些什么来改变结果。反事实示例不仅必须反驳黑盒分类器的原始预测,还应满足实际应用的各种约束。多样性是讨论较少的关键约束之一,虽然多样的反事实解释是理想的,但同时满足一些其他约束在计算上具有挑战性。

此外,针对发布的反事实数据的隐私问题日益受到关注。为此,作者提出了一个基于特征的学习框架,可以有效处理反事实约束,并为有限的私密解释模型池贡献自身。作者展示了该方法在生成具有可行性和合理性的多样反事实解释方面的灵活性和有效性。与同等容量的对应部分相比,作者的反事实引擎更高效,而重新识别风险也最低。

KDD时间检验奖

研究方向

Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms

标题:Auto-WEKA: 分类算法的组合选择和超参数优化

作者:Chris Thornton ,Frank Hutter, Holger H. Hoos, Kevin Leyton-Brown

内容:存在许多不同的机器学习算法,考虑到每个算法的超参数,总体上有令人难以置信的大量可能的替代方案。作者考虑同时选择学习算法并设置其超参数的问题,这超越了以前仅单独解决这些问题的工作。作者表明这个问题可以通过一个完全自动化的方法来解决,利用贝叶斯优化的最新创新。

具体而言,作者考虑了广泛的特征选择技术(组合3种搜索方法和8种评估方法)以及WEKA中实现的所有分类方法,跨越2种集成方法、10种元方法、27种基本分类器以及每个分类器的超参数设置。在来自UCI仓库、KDD Cup 09、MNIST数据集的变体和CIFAR-10的21个流行数据集上,作者展示的分类性能通常比使用标准选择/超参数优化方法好很多。

应用数据科学方向

Ad Click Prediction: A View From the Trenches

标题:广告点击预测:来自第一线的视角

作者:Hugh Brendan McMahan, Gary Holt, David Sculley, Michael Young, Dietmar Ebner, Julian Grady, Lan Nie, Todd Phillips, Eugene Davydov, Daniel Golovin, Sharat Chikkerur, Dan Liu, Martin Wattenberg, Arnar Mar Hrafnkelsson, Tom Boulos, Jeremy Kubica

内容:预测广告点击率(CTR)是在数十亿美元的在线广告业中处于核心地位的大规模学习问题。作者介绍了一些案例研究和话题,这些内容来自部署的CTR预测系统的最近实验。这包括在传统监督学习框架下的改进,该框架基于FTRL-Proximal在线学习算法(具有出色的稀疏性和收敛特性)以及每坐标学习率。

作者还探讨了一些在实际系统中出现但乍一看似乎不在传统机器学习研究领域内的挑战。这包括用于内存节省的有用技巧、评估和可视化性能的方法、为预测概率提供置信度估计的实际方法、校准方法以及自动管理特征的方法。本文的目标是强调理论进步与该工业环境下的实际工程之间的密切关系,并展示将传统机器学习方法应用于复杂动态系统时出现的深层挑战。

​杰出论文奖

On the Predictive Power of Graph Neural Networks

标题:关于图神经网络的预测能力

作者:Weihua Hu

内容:在本论文中,作者旨在通过理解、改进和基准测试GNNs的预测能力来构建强大的预测性GNNs,预测能力指GNNs进行准确预测的能力。本文由三个部分组成。在第I部分中,作者为理解GNNs的预测能力开发了一个理论框架。具体关注表达能力,询问GNNs是否可以表达期望的图函数。作者使用理论框架为给定GNN是否足够强大提供洞见,以对数据中的地面真值目标函数建模。

作者还提出了一个可以证明对图的大多数函数建模的最大表达能力GNN模型。在配备了设计表达能力强的GNN模型的框架之后,在第II部分中,作者继续提高它们在未见/未标记的数据上的预测能力,即提高GNNs的泛化能力。出于实际应用的考虑,作者在两个常见的有限数据场景下开发了提高GNN泛化能力的方法:有限标签数据和有限边连接性。最后,在第III部分中,作者创建了新的图基准数据集,以解决现有基准的问题,并促进社区提高GNN的预测能力。

杰出论文奖(亚军)

Characterization and Detection of Disinformation Spreading in Online Social Networks

标题:在线社交网络中虚假信息传播的特征和检测

作者:Francesco Pierri

内容:在这项工作中,作者利用网络和计算机科学方法来解决在线社交网络中虚假信息传播的问题。关注Twitter和Facebook,研究在政治选举和新冠疫情等相关事件期间,虚假信息和其他恶意内容传播所涉及的机制和参与者,因为公众此时对可靠信息的需求更高。作者对主流和传统新闻网站发布的可靠信息与反复被曝光传播虚假信息、误导信息、恶作剧、假新闻和极端宣传的网站传播的不可靠信息进行了系统性比较。

作者建立了一个回归模型,考虑了人口统计学、社会经济和政治因素,发现在线虚假信息与疫苗结果之间存在显著关联。最后,基于上述分析的结果,作者部署了一种方法来准确分类Twitter上用户自然交互的新闻文章。按照用户根据分享内容塑造不同传播模式的直觉,训练和测试现成的机器学习分类器,可以对新闻文章的真实性进行分类,而无需查看其内容。

Efficient and Secure Message Passing for Machine Learning

标题:机器学习的高效和安全的消息传递

作者:Xiaorui Liu

内容:机器学习(ML)技术给人类社会带来了革命性影响,未来它们也将继续作为技术创新者发挥作用。为了扩大其影响,迫切需要解决机器学习中出现的新兴和关键挑战,如效率和安全问题。

本论文的主要目标是通过创新研究和原理方法找出解决这些挑战的解决方案。特别是,作者提出了多种具有高效消息传递的分布式优化算法,以缓解通信瓶颈并加速分布式ML系统中的ML模型训练。作者还提出了多种安全消息传递方案作为图神经网络的构建模块,旨在显着提高ML模型的安全性和鲁棒性。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“KDD”获取全部获奖论文+代码合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/890240.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言入门教程,C语言学习教程(非常详细)第五章 循环结构与选择结构

C语言if else语句详解 前面我们看到的代码都是顺序执行的,也就是先执行第一条语句,然后是第二条、第三条……一直到最后一条语句,这称为顺序结构。 但是对于很多情况,顺序结构的代码是远远不够的,比如一个程序限制了只…

【Javaswing课设源码】学生信息管理 Mysql课程设计 管理员 教师 学生

文章目录 系统介绍 系统介绍 大学时代弄的一个课设,当时百度[学长敲代码]找的代做,代码思路很清晰,完全按照我的功能需求去做的,主要是价格便宜,真的爱了,现在回头学习也是不错的一个项目。大概内容如下 本…

springboot里 用zxing 生成二维码

引入pom <!--二维码依赖--><dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.3.3</version></dependency><dependency><groupId>com.google.zxing</groupId>…

【分类讨论】CF1674 E

Problem - E - Codeforces 题意&#xff1a; 思路&#xff1a; 样例&#xff1a; 这种分类讨论的题&#xff0c;主要是去看答案的最终来源是哪几种情况&#xff0c;这几种情况得不重不漏 Code&#xff1a; #include <bits/stdc.h>#define int long longusing i64 lon…

尚硅谷css3笔记

目录 一、新增长度单位 二、新增盒子属性 1.border-box 怪异盒模型 2.resize 调整盒子大小 3.box-shadow 盒子阴影 案例&#xff1a;鼠标悬浮盒子上时&#xff0c;盒子有一个过度的阴影效果 三、新增背景属性 1.background-origin 设置背景图的原点 2.background-clip 设置背…

基于IMX6ULLmini的linux裸机开发系列一:汇编点亮LED

思来想去还是决定记录一下点灯&#xff0c;毕竟万物皆点灯嘛 编程步骤 使能GPIO时钟 设置引脚复用为GPIO 设置引脚属性(上下拉、速率、驱动能力) 控制GPIO引脚输出高低电平 使能GPIO时钟 其实和32差不多 先找到控制LED灯的引脚&#xff0c;也就是原理图 文件名 C:/Us…

自动提示功能消失解决方案

如果绿叶子是不可点击状态&#xff0c;可以点一下列表中的配置文件

43、TCP报文(一)

本节内容开始&#xff0c;我们正式学习TCP协议中具体的一些原理。首先&#xff0c;最重要的内容仍然是这个协议的封装结构和首部格式&#xff0c;因为这里面牵扯到一些环环相扣的知识点&#xff0c;例如ACK、SYN等等&#xff0c;如果这些内容不能很好的理解&#xff0c;那么后续…

A. Copil Copac Draws Trees(Codeforces Round 875 (Div. 1))

Copil Copac is given a list of n − 1 n-1 n−1 edges describing a tree of n n n vertices. He decides to draw it using the following algorithm: Step 0 0 0: Draws the first vertex (vertex 1 1 1). Go to step 1 1 1.Step 1 1 1: For every edge in the inpu…

号外号外,最经典的16S数据库Greengenes2更新啦!!!

没错&#xff0c;这是真的&#xff0c;沉积十年之后&#xff0c;多样性研究中最经典的16S数据库——Greengenes数据库&#xff0c;竟&#xff01;然&#xff01;更&#xff01;新&#xff01;了&#xff01;惊不惊喜&#xff01;意不意外&#xff01; 遥想当年小编还是一个小白…

vue 数字递增(滚动从0到)

使用 html <Incremental :startVal"0" :endVal"1000" :duration"500" />js&#xff1a; import Incremental from /utils/num/numViewjs let lastTime 0 const prefixes webkit moz ms o.split( ) // 各浏览器前缀let requestAnimatio…

基于YOLOv5n/s/m不同参数量级模型开发构建茶叶嫩芽检测识别模型,使用pruning剪枝技术来对模型进行轻量化处理,探索不同剪枝水平下模型性能影响

今天有点时间就想着之前遗留的一个问题正好拿过来做一下看看&#xff0c;主要的目的就是想要对训练好的目标检测模型进行剪枝处理&#xff0c;这里就以茶叶嫩芽检测数据场景为例了&#xff0c;在我前面的博文中已经有过相关的实践介绍了&#xff0c;感兴趣的话可以自行移步阅读…

QT的设计器介绍

设计器介绍 Qt制作 UI 界面&#xff0c;一般可以通过UI制作工具QtDesigner和纯代码编写两种方式来实现。纯代码实现暂时在这里不阐述了在后续布局章节详细说明&#xff0c;QtDesigner已经继承到开发环境中&#xff0c;在工程中直接双击ui文件就可以直接在QtDesigner设计器中打…

AtCoder Beginner Contest 314 E题题解

文章目录 Roulettes问题建模问题分析1.分析每个转盘对所求的作用2.从集合的角度思考每个积分的贡献代码 Roulettes 问题建模 给定n个轮盘&#xff0c;每个轮盘上有p个积分&#xff0c;每次转动轮盘需要一定的代价&#xff0c;在转动轮盘后可以等概率获得p个积分中的一个&#…

【通俗易懂】如何使用GitHub上传文件,如何用git在github上传文件

目录 创建 GitHub 仓库 使用 Git 进行操作 步骤 1&#xff1a;初始化本地仓库 步骤 2&#xff1a;切换默认分支 步骤 3&#xff1a;连接到远程仓库 步骤 4&#xff1a;获取远程更改 步骤 5&#xff1a;添加文件到暂存区 步骤 6&#xff1a;提交更改 步骤 7&#xff1a…

频繁full gc 调参

Error message from spark is:java.lang.Exception: application_1678793738534_17900289 Driver Disassociated [akka.tcp://sparkDriverClient11.71.243.117:37931] <- [akka.tcp://sparkYarnSQLAM9.10.130.149:38513] disassociated! 日志里频繁full gc &#xff0c;可以…

nginx代理请求到内网不同服务器

需求&#xff1a;之前用的是frp做的内网穿透&#xff0c;但是每次电脑断电重启&#xff0c;路由或者端口会冲突&#xff0c;现在使用汉土云盒替换frp。 需要把公网ip映射到任意一台内网服务器上&#xff0c;然后在这台内网服务器上用Nginx做代理即可访问内网其它服务器&#xf…

微服务中间件--微服务保护

微服务保护 微服务保护a.sentinelb.sentinel限流规则1) 流控模式1.a) 关联模式1.b) 链路模式 2) 流控效果2.a) 预热模式2.b) 排队等待 3) 热点参数限流 c.隔离和降级1) Feign整合Sentinel2) 线程隔离2.a) 线程隔离&#xff08;舱壁模式&#xff09; 3) 熔断降级3.a) 熔断策略-慢…

Xshell安装使用教程安排~

简介 Xshell 是一个强大的安全终端模拟软件&#xff0c;它支持SSH1, SSH2, 以及Microsoft Windows 平台的TELNET 协议。Xshell 通过互联网到远程主机的安全连接以及它创新性的设计和特色帮助用户在复杂的网络环境中享受他们的工作。 Xshell可以在Windows界面下用来访问远端不…

蔚来李斌卖手机:安卓系统,苹果售价,一年一发

‍作者 | Amy 编辑 | 德新 车圈大佬的玩法真让人寻不着套路&#xff01; 苹果的库克和小米的雷布斯&#xff0c;甚至是FF贾老板准备许久&#xff0c;都想分一块新能源车的蛋糕&#xff0c;蔚来李斌却反手进军手机界&#xff0c;从宣布造手机到手机入网仅仅隔了一年。 近期…