DSSM - 双塔经典模型（微软）

news2026/3/28 10:49:28

《Learning Deep Structured Semantic Models for Web Search using Clickthrough Data》
论文由微软发表于 CIKM-2013。DSSM被广泛用于工业界的召回/粗排阶段。

模型结构

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nBZG1A6K-1684400460589)()]

模型结构一目了然，非常简单，双塔结构：user侧一个塔，item一个塔，塔用的是MLP。底层各自有各自的embedding。两塔输出特征维度一致，最后做内积或cosine来计算相似度；损失函数用二分类交叉熵即可。
dssm的缺点也很明显：无法做user和item的交叉/交互特征。（可参考：新浪微博张俊林的尝试SENet，如何在双塔模型中做user和item的交叉/交互）

DSSM - 召回阶段用法

现在工业界的推荐系统的召回阶段基本上多路召回，比如CF召回、CB召回、语义向量召回等，DSSM召回也是语义向量召回的一种。

dssm的离线训练（召回阶段）

大佬的名言：“如果精排是特征的艺术，那么召回就是样本的艺术（负样本为王）”。负样本的构造对于召回阶段来说非常非常重要！

召回阶段的正样本即用户点击过的item。那负样本的选择应该是面向的全量候选item中取，而不是从已曝光未点击的item中（避免样本选择偏差问题-SSB）。
dssm的做法是，数据集里只有正样本item（即用户点击过的item）；对于某个用户，而负样本的选取则是从数据集 (不包含这个用户点击过的item)中随机选则4个item作为负样本。【其他常见的负样本构造方法，请参阅我的博文：召回或粗排阶段常见负样本构造方法】

dssm的在线推理（召回阶段）

dssm之所以能够在工业界这么流行，就是因为其双塔结构能够做到非常好的解耦，即训练好后user侧塔和item侧塔完全没关系，没有依赖关系。
可提前存好item embedding（间隔一定时间更新），user侧请求计算出user embedding后，就可以去item库里做ANN检索出top n个最相似的item。关于ANN检索技术比较有很多，比如：kd树、Annoy、HNSW等，Facebook开源了ANN库FAISS（这个我好像经常听说）。
所以，很明显了，dssm并不能做user和item的交叉/交互特征。

DSSM - 粗排阶段用法

和召回差不多用法，区别如下：

训练集不一样：因为粗排和精排的目标是一致的，所以负样本用的和精排一样的，都是曝光未点击的。
在线推理时候选集不一样：召回的候选集是全局物料池，而粗排时的是多路召回后的候选item集。

大佬的工程经验参考：

如果召回的dssm模型和粗排的dssm模型，在特征、样本都一样的情况下，则dssm召回的item大部分都会被粗排排出去，注意这里是大部分，从我们的实践中大概有一半的会被排出去，至于为什么没有全部都被排出去，原因应该是数据中存在multi-view，即使特征、样本、网络结构都一样，只要参数初始化是随机的，网络最终也会学到不同的view。

参考链接：https://blog.csdn.net/u012328159/article/details/123782735

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/540695.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

ChatGPT的兴起的时代，国内chatgpt产品大盘点

ChatGPT的兴起的时代，国内chatgpt产品大盘点

在人工智能技术的不断发展和应用下，自然语言处理技术成为了研究的热点之一。而其中最受关注的就是“聊天机器人”技术，而GPT（Generative Pre-trained Transformer）模型则是目前最流行的聊天机器人生成模型之一。随着 ChatGPT 技…

阅读更多...

蓝牙RSSI/BLE AOA/UWB室内定位技术哪个好?

蓝牙RSSI/BLE AOA/UWB室内定位技术哪个好?

蓝牙AOA定位技术的出现，弥补了蓝牙RSSI值定位精度不高的缺陷。从理论上来说，可以对目前的蓝牙RSSI定位方案进行一定程度的替代。当然了，在高精度定位应用领域中，UWB定位已经在批量的成熟商用了。蓝牙AOA也具有很高的定位精度&…

阅读更多...

单位网站被黑被下达整改进行行政处罚

单位网站被黑被下达整改进行行政处罚

最近这几年，由于信息系统安全等级保护法的普及，越来越多公司收到当地公安网监部门打来的电话，说你们公司网站有漏洞，需要限期在2-3内进行漏洞整改和加固，遇到这种情况，不要着急，下面来分享一下该…

阅读更多...

JavaEE(系列8) -- 多线程案例(单例模式)

JavaEE(系列8) -- 多线程案例(单例模式)

目录 1. 设计模式 2. 单例模式 -- 饿汉模式 3. 单例模式 -- 懒汉模式 4. 单例模式(懒汉模式-多线程) 1. 设计模式什么是设计模式? 设计模式好比象棋中的 "棋谱". 红方当头炮, 黑方马来跳. 针对红方的一些走法, 黑方应招的时候有一些固定的套路. 按照套路…

阅读更多...

【融合感知】激光雷达和相机融合感知-BEVFusion

【融合感知】激光雷达和相机融合感知-BEVFusion

BEVFusion有两篇文章，这里在一起分析下不同，分别是： 【1】BEVFusion: A Simple and Robust LiDAR-Camera Fusion Framework. 【2】BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation 先说结论&…

阅读更多...

品牌联名又出圈了！小红书数据揭示，引爆流量三部曲

品牌联名又出圈了！小红书数据揭示，引爆流量三部曲

这几天，你们的朋友圈是不是被喜茶FENDI黄刷屏啦？近日，茶饮品牌牵手意大利奢侈品牌联名上新，一跃成为各平台热门。品牌新联名，这次又出圈了！ 喜茶可谓是联名界的老玩家了，曾与藤原浩、《梦华录》…

阅读更多...

HTML5新增标签

HTML5新增标签

前言 HTML5的新特性主要是针对以前的不足，增加了一些新标签，新表单和新表单属性但是呢！这些标签大多都存在兼容性的问题，基本是IE9以上的版本才支持之前我们做布局，都用的是div，但是没有语义性 HTM…

阅读更多...

Java开发的多商户商城系统源码小程序app

Java开发的多商户商城系统源码小程序app

Java开发的多商户商城系统源码小程序app主要是为商家提供一个线上销售平台，实现商品展示、订单管理、支付等功能，并且支持多商户注册，以下是它的功能介绍： 一、用户端：1. 用户注册与登录：用户可以使用手机…

阅读更多...

关于LimeReport导出报告在Qt下的使用问题

关于LimeReport导出报告在Qt下的使用问题

关于这个第三方库的使用网上有很多资料了具体说一下关于文本和图片控件的使用 1、文本使用如果需要自定义文本内容，需要的格式为上图$V{}; 2、图片使用如果需要自定义图片内容，需要的格式为上图$V{}，写法和文本内容一样； 3、…

阅读更多...

博士毕业答辩流程注意事项

博士毕业答辩流程注意事项

前言：2023年5月17日14:00-17:00，与实验室其他同学一起旁听了本实验室的博士论文答辩。接下来，我对博士毕业答辩的大致流程进行简要介绍，并对个环节的注意事项进行总结归纳，供毕业生参考。目录 1. 准备阶段2. 汇报期间…

阅读更多...

Python 框架学习 Django篇 (一) 安装及基本使用

Python 框架学习 Django篇 (一) 安装及基本使用

环境说明 python 3.11.3 Django 4.2.1 idea 2023.1 一、安装调试我这里默认idea和python环境都是装好的，直接从建项目开始新建项目项目名称: demo 安装Django //配置清华镜像源 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simp…

阅读更多...

AMBER分子动力学模拟之结果分析(突变型的能量计算,丙氨酸扫描)-- HIV蛋白酶-抑制剂复合物(5)

AMBER分子动力学模拟之结果分析(突变型的能量计算,丙氨酸扫描)-- HIV蛋白酶-抑制剂复合物(5)

AMBER分子动力学模拟之结果分析(突变型的能量计算,丙氨酸扫描)-- HIV蛋白酶-抑制剂复合物(5) 丙氨酸扫描在带电残基上引入一个或几个丙氨酸，观察这些改变对蛋白功能的影响。置换成丙氨酸，去除了侧链上的活性基团，换成了体积小、无其他官能…

阅读更多...

【AGC】新版鸿蒙崩溃SDK集成使用方法

【AGC】新版鸿蒙崩溃SDK集成使用方法

【背景】我们知道AGC的Crash SDK都是需要强制集成华为分析SDK的，在使用时的崩溃数据上报都要依靠分析服务来完成，这就容易受到限制，有时出现无数据的情况就要依次排查崩溃SDK与分析SDK，比较麻烦。而就在不久前，鸿蒙崩…

阅读更多...

【Linux】内存映射

【Linux】内存映射

目录内存映射相关函数解析代码示例1（使用内存映射实现没有关系的进程间的通信）：代码示例2（使用内存映射实现文件间拷贝）：匿名内存映射橙色内存映射内存映射(Memory-mapped I/o)是将磁盘文件的数据映射…

阅读更多...

GitLabRunner安装部署

GitLabRunner安装部署

实战：GitLabRunner安装部署-2023.4.26(安装成功) 目录实验环境 gitlab/gitlab-ce:15.0.3-ce.0 gitlab-runner-15.0.1-1.x86_64.rpm实验软件链接：https://pan.baidu.com/s/10aL_kWzDKnZXBXG3-hS2tA 提取码：0820 2023.4.26-实战&#xff1a…

阅读更多...

HTTP第16讲——HTTP的重定向和跳转

HTTP第16讲——HTTP的重定向和跳转

背景 “超文本”里含有“超链接”，可以从一个“超文本”跳跃到另一个“超文本”，对线性结构的传统文档是一个根本性的变革。能够使用“超链接”在网络上任意地跳转也是万维网的一个关键特性。它把分散在世界各地的文档连接在一起，形成了复杂…

阅读更多...

058：cesium设置图片纹理材质

058：cesium设置图片纹理材质

第058个点击查看专栏目录本示例的目的是介绍如何在vue+cesium中设置图片材质，相当于在球体上贴图。直接复制下面的 vue+cesium源代码，操作2分钟即可运行实现效果. 文章目录示例效果配置方式示例源代码（共85行）相关API参考：专栏目标示例效果配置方式 1）查看基础设…

阅读更多...

如何批量旋转图片方向，包教会方法分享

如何批量旋转图片方向，包教会方法分享

如何批量旋转图片方向，这个怎么搞呢？小编曾经遇到一个问题，就是我将手机上的照片上传到电脑后发现所有的图片都是倒立的，这让查看变得非常不方便。尽管小编已经尝试过打开每张图片并逐个旋转后再另存为，但这种方式十分…

阅读更多...

qiankun + Vite + React + Vue + Angular 快速构建前端微服务

qiankun + Vite + React + Vue + Angular 快速构建前端微服务

文章目录一、主应用 vite二、微应用 react三、微应用 vue四、微应用 angular五、项目地址一、主应用 vite npm npm create vitelatestyarn yarn create vite选择是否继续 Need to install the following packages:create-vite3.2.1 Ok to proceed? (y) y项目名称 Project…

阅读更多...

HIVE建表详细教程

HIVE建表详细教程

1. 注意事项如下 1.1 分区字段可以有多个分区字段，一般以时间维度来建立分区，也可以再加其他字段。以业务场景为提前条件，来设定分区的字段。从业务角度理解，分区字段可理解为业务数据的一部分，作为业务查询…

阅读更多...

推荐文章

最新文章