网络嵌入综述

news2024/11/26 22:23:13

图嵌入综述整理(上)
在这里插入图片描述
来源:图算法探索系列(一):图嵌入模型的原理和应用篇【万字长文】
图9是DeepWalk模型在推荐场景下的应用。图9(a)显示的是不同用户在不同Session中的item点击序列。用Item2vec或Airbnb embedding的方法,Word2vec模型可以直接在这些序列信息上对节点进行嵌入学习。但图中用户的Session行为都偏短,会导致序列中item学习出来的embedding质量并不理想。DeepWalk会根据每个Session中item的共现信息和出现的次序,构建一个全局的item有向图(图9(b))。然后以每个item节点为起始节点,进行截断式随机游走产生新的item序列。从图9(c)中可以看出,因为随机游走对图结构的局部探索能力,我们可以得到一些原来并没有见过的item序列,例如:“ABE”序列。因此,后续的表示学习模型可以拥有更丰富的数据来学习每个节点的embedding。最后,通过随机游走生成的item序列都会被送入Skip-gram模型中进行节点的embedding学习。

值得一提,随机游走不仅可以完成图结构到序列信息的转换,还可以并行地为每个节点生成序列信息,这为DeepWalk模型应用在大规模图结构上提供了可行性。腾讯TEG数平的Angel团队在公司太极平台提供了非常丰富的图算法组件供使用。DeepWalk这种二阶段的图嵌入学习框架,也被后续很多Graph Embedding方法所采用。所以,DeepWalk在学术界和工业界,都是一个很常见的Graph Embedding baseline。
在这里插入图片描述
图12 腾讯新闻Graph Embedding建模过程

如图12所示,新闻的同事们提出的Graph Embeddnig的整体思路与DeepWalk类似,他们主要的改进工作体现在图构建阶段,希望在构建图阶段,通过改变节点之间边的权重来调整随机游走所得到的的序列结果,使得生成的训练节点序列更符合腾讯新闻的业务场景。在基于腾讯新闻的用户行为数据构建图的时候,新闻同事们提出了两点有意思的思考:

Item的曝光信息极有可能影响item之间的共现,比如曝光更多的item往往更容易共现。因此,item曝光信息也应该反映在图中item节点之间的边权重上;
Item之间的推荐关系是有向的,新闻场景中可以在冷门内容后推荐相关的热门新闻,但是未必适合在热门新闻后推荐相关的冷门内容。
基于这两个前提,新闻的同事提出了一种叫做ACF的算法计算图中节点之间的边权重。最终学习到的item embedding在视频召回中上线,并在点击vv和总vv上都取得了明显的提升。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1213360.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

8年经验的软件工程师建议

我希望在职业生涯早期就开始做的事情和我希望以不同的方式做的事情。 大家好,我已经做了八年半的软件工程师。这篇文章来源于我最近对自己在职业生涯中希望早点开始做的事情以及希望以不同方式做的事情的自我反思。 我在这里分享的对任何希望提高和进步到高级甚至…

【PyQt小知识 - 2】:QTextEdit内容的更新和获取、隐藏或显示滚动条、光标插入文本、文本自适应移动

文章目录 QTextEdit更新和获取内容隐藏或显示滚动条光标插入文本文本自适应移动 QTextEdit 更新和获取内容 更新:QTextEdit().setText(text) 或 QTextEdit().setPlainText(text) 获取:QTextEdit().toPlainText() setText()和setPlainText()的区别&…

自动化测试Mock神器:轻松模拟HTTP请求..

一、背景 在日常测试过程中或者研发开发过程中,目前接口暂时没有开发完成,测试人员又要提前介入接口测试中,测试人员不仅仅只是简单的编写测试用例,也可以通过一些mock的方法进行来提前根据接口测试的情况进行模拟返回接口的信息…

怎么选好用的电脑监控软件

在选择好用的电脑监控软件时,需要考虑多个因素,包括功能和特性、安全性和隐私保护、用户界面、实时监控和报警功能、日志记录和报告功能、兼容性以及用户评价和口碑等。 首先,需要明确你需要监控的内容,例如屏幕活动、应用程序使用…

U盘变成了.lnk,怎么处理

没曾想客户电脑是是不是有个病毒啥的,把我的U盘直接干成了只有一个.lnk的一个快捷方式,后面百度找了很多方法,最后找到了一个非常实用的方法,后整理了一下交给大家 方法如下: 1.找到电脑U盘文件 2.搜索框中输入你之…

正则提取记录

使用正则 https?:\/\/([^\/\s])/

TikTok女性创作者:媒体世界的新领袖

在数字时代,社交媒体已成为媒体和娱乐产业的关键组成部分,而TikTok作为最受欢迎的短视频分享平台之一,为女性创作者提供了一个独特的机会来在媒体世界中崭露头角。 这个平台不仅为女性创作者提供了一个创作和分享自己的声音、观点和创意的空…

Arthas搭建与使用

背景 在平时开发过程中经常会遇到日志打印有问题、代码不知道是否执行、定位运行缓慢的代码段等需求,这时往往需要排查很久,并且由于我们基于docker进行部署,一旦有问题要发包调试的话构建过程还是比较复杂耗时的,有时候打包只是…

为什么说MES管理系统是车间层与管理层的桥梁

随着制造业的快速发展,企业对于生产过程中的管理要求越来越高。为了满足这一需求,MES生产管理系统应运而生。MES管理系统作为车间层与管理层之间的桥梁,扮演着至关重要的角色。本文将探讨为什么说MES管理系统是车间层与管理层之间的桥梁。 一…

动画短片怎么制作gif?一个方法简单又好用

网络上常常能看到动画短片,虽然时长短但是内容很丰富。当我们想要将这种动画短片做成gif格式图片的时候,应该怎么办呢?很简单,通过使用在线制作动画(https://www.gif.cn/)网站,无需下载软件上传…

uniapp生成自定义(分享)图片并保存到相册

需求描述 在一个页面中底部有个保存图片的功能,点击能够保存一张生成的自定义表格图片。 第一眼见到这个需求 自己会出现了两个问题 如何去处理图片中的自定义内容以及样式如何将自定义内容转化成图片 至于保存图片,uniapp有对应的api去实现uni.saveIma…

顶象获“直通乌镇”全球互联网大赛二等奖

11月10日,2023“直通乌镇”全球互联网大赛在浙江乌镇圆满落幕。本次大赛由世界互联网大会、浙江省人民政府主办,旨在探索互联网发展的新技术、新模式、新业态,推动全球互联网合作创新,激发互联网创业活力。 在当天的颁奖典礼上&a…

栈:括号匹配问题!

目录 题目: 思路分析: 解题思路: 一、配对: 二、数量问题: 三、细节问题: 完整代码: 手撕栈: 题目: 给定一个只包括 (,),{,}&…

微签:电子签章实力派,这19年从幕后走向台前

微签是什么?尽管在电子签章领域已深耕19年 ,是国内电子签名市场的拓荒者之一,但因为其低调的风格,一直不为众人所知。不过,如果现在你想对目前市面上的电子签名厂商做一个专业客观的盘点的话,不管从哪个角度…

【论文精读2】R-MVSNet

R-MVSNet【递归多视图立体网络】,论文全名:“Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference”,CVPR 2019(CCF A) 在MVSNet的基础上做了一些改进,主要解决的问题是代价体正则化(Cost Volume…

大语言模型概述|亚马逊这些互联网公司为什么花巨资训练自己的模型?

2023年可谓是大语言模型元年,OpenAI、亚马逊、谷歌等互联网公司争先恐后推出了自己的大语言模型:GPT-4、Titan、PaLM 2,还有亚马逊即将推出的第二个大语言模型Olympus等等。这一革命性技术如今已经在全球范围内引发了广泛的讨论和关注&#x…

用于部署汽车AI项目的全面自动化数据流程

如何创建、优化和扩展汽车 AI 的数据流程 想到汽车行业的人工智能 (AI) 时,脑海中可能会立即浮现未来的道路上遍布自动驾驶汽车的情景。虽然这一切尚未实现,但汽车行业已在 AI 方面取得诸多进步,不仅安全性提高,车内体验也得到改…

餐饮展示小程序的作用是什么

餐饮是市场重要的组成部分,尤其是我国八大菜系,各类细分菜数量非常多,并分布在全国,各类大小品牌餐饮商家数量也非常庞大,每个城市的商业街都是一个接一个餐厅,酒类、酒店多样。 餐饮行业经营痛点比较明显…

C++入门,详解类和对象(1)

类和对象 一,前言二,类的介绍2.1类的引入2.2类的定义 三,类访问限定符及其分装3.1访问限定符说明 四,类的作用域五,类的实例化六,类对象模型6.1类的存储方式6.2类的大小计算 七,this指针7.1this…

Java_static 继承

static static修饰成员变量 static修饰成员变量的应用场景 static修饰成员方法 static修饰成员方法的应用场景 static的注意事项 static的应用知识:代码块 static的应用知识:单例设计模式 饿汉式单例模式 懒汉式单例模式 面向对象三大特征之二:继承 什么是继承 继承的好处 继…