【电商推荐】平衡效率与效果:一种优化点击率预测的LLM融合方法

news2025/2/26 8:30:22

【电商推荐】平衡效率与效果:一种优化点击率预测的LLM融合方法


目录

文章目录

  • 【电商推荐】平衡效率与效果:一种优化点击率预测的LLM融合方法
    • 目录
      • 文章
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 创新点
      • 算法模型
        • 多级知识蒸馏模块(MKDM)
        • 多级知识整合模块(MKIM)
      • 实验效果
        • 数据集
        • 基线模型
        • 评估指标
        • 结果
      • 推荐阅读指数:★★★★☆
    • 后记


文章

在这里插入图片描述

Balancing Efficiency and Effectiveness: An LLM-Infused Approach for Optimized CTR Prediction
平衡效率与效果:一种优化点击率预测的LLM融合方法

摘要

本文探讨了在线广告中点击率(CTR)预测的重要性,强调了语义信息在塑造用户决策和提高CTR效果中的关键作用。作者提出了一种新颖的方法,利用大型语言模型(LLMs)的全面世界知识能力,端到端地建模深度语义信息。提出的LLM融合CTR预测框架(Multi-level Deep Semantic Information Infused CTR model via Distillation, MSD)旨在通过利用LLMs提取和蒸馏关键信息到更小、更高效的模型中,实现无缝的端到端训练和推理。该框架精心设计,以平衡效率和效果,确保模型不仅实现高性能,而且以最优的资源利用率运行。在美团赞助搜索系统上进行的在线A/B测试表明,该方法在每千次展示成本(CPM)和CTR方面显著优于基线模型,验证了其在现实世界应用中的有效性、可扩展性和平衡方法。

研究背景

在线广告领域中,CTR预测是推荐系统和在线广告的核心组成部分。语义信息,尤其是用户对产品或服务的偏好,对于提高广告效果至关重要。传统的语义建模往往忽略了用户和项目层面的这些复杂细节。为了弥补这一差距,本文介绍了一种新的方法,该方法通过LLMs提取和蒸馏关键信息,以实现深度语义信息的建模。
在这里插入图片描述

问题与挑战

  1. 深度语义信息的捕捉与建模:如何捕捉和建模用户对产品或服务的深层次偏好和意图是一个挑战。
  2. 效率与效果的平衡:在保持模型高性能的同时,如何优化资源利用,提高模型的运行效率。
  3. 实际工业环境中的应用:大多数现有研究在实际工业环境中的CTR预测应用中效率和效果的平衡尚未得到充分考虑。

如何解决

为了解决上述挑战,作者提出了MSD框架,该框架通过以下方式实现:

  • 知识蒸馏:利用知识蒸馏技术将LLMs的内部能力转移到更小的模型中,以提高效率。
  • 多级知识蒸馏模块(MKDM):通过基于提示的方法结合链式推理(CoT)生成推理过程,并在项目和用户层面提取显式和隐式信息。
  • 多级知识整合模块(MKIM):将语义洞察无缝整合到CTR预测框架中,包括LoRA、特征适配器和频率自适应相关项目融合。
    在这里插入图片描述
    在这里插入图片描述

创新点

  1. LLM融合CTR预测方法:通过知识蒸馏范式引入LLM,平衡效率和效果。
  2. 多级知识蒸馏模块和多级知识整合模块的开发:这些模块能够提取和整合深度语义信息,提高CTR预测的准确性。
  3. 在线A/B测试的成功部署:在美团推荐平台上实现了2.12%的CTR提升和2.59%的CPM提升。

算法模型

MSD框架包含两个主要模块:多级知识蒸馏模块(MKDM)和多级知识整合模块(MKIM)。

多级知识蒸馏模块(MKDM)
  • 知识生成:通过手动选择的ChatGPT输出作为参考,使用动态选择的参考输出作为上下文学习的例子,生成包含显式和隐式信息的输出。
  • 知识蒸馏:利用知识蒸馏将LLMs教师模型的语义和上下文推理能力转移到更高效的学生模型。
多级知识整合模块(MKIM)
  • LoRA:使用低秩适配器对蒸馏后的LLMs进行微调,以提高计算效率。
  • 特征适配器:使用多层感知机(MLP)压缩和转换LLM输出嵌入,确保有效整合到CTR模型中。
  • 频率自适应相关项目融合:通过掩码和池化操作增强项目嵌入的鲁棒性。

实验效果

数据集
  • KDD Cup 2012:包含腾讯广告日志的CTR预测数据集,包括查询和用户信息。
  • 美团:来自美团推荐平台的实际数据集,包含广泛的用户-项目交互数据。
基线模型
  • DIN、DeepFM、DeepCharMatch、SuKD、BERT4CTR、PRINT等流行的CTR基线模型。
评估指标
  • 蒸馏评估指标:基于预测关键词的F1分数,使用BERT模型生成的嵌入来确定短语等价性。
  • 模型性能指标:主要使用AUC评估模型性能,同时使用相对改进(RelaImpr)指标来量化模型相对于现有模型的性能提升。
结果
  • 性能比较:MSD框架在两个数据集上均显示出优越的性能,与PRINT相比,在KDD Cup 2012和美团数据集上的AUC分别提高了0.25%和0.63%。
  • 消融研究:每个模块都对整体性能提升有显著贡献。
  • LLM蒸馏效果:知识蒸馏过程与CTR模型性能之间存在正相关关系。
  • 在线部署和A/B测试结果:在美团赞助搜索广告系统上进行的在线A/B测试中,MSD模型在CTR上实现了2.12%的提升,在CPM上实现了2.59%的提升。

在这里插入图片描述

推荐阅读指数:★★★★☆


后记

如果您对我的博客内容感兴趣,欢迎三连击(点赞,关注和评论),我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型,深度学习,计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2264421.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Y3编辑器教程6:触发器进阶案例

文章目录 一、地形制作1.1 地形制作流程1.2 关卡白盒1.3 场景美化1.4 优化场景 二、触发结构三、玩家指引(函数封装)3.1 项目拆解3.2 功能实现3.2.1 绘制UI界面3.2.2 UI的读取显示和刷新3.2.3 交互功能3.2.4 最终实现 四、NPC对话系统4.1 项目拆解4.2 UI…

2024年11月 蓝桥杯青少组 STEMA考试 Scratch真题

2024年11月 蓝桥杯青少组 STEMA考试 Scratch真题(选择题) 题目总数:5 总分数:50 选择题 第 1 题 单选题 Scratch运行以下程宇后,小兔子会( )。 A. 变小 B. 变大 C. 变色 D. …

ZED-OpenCV项目运行记录

项目地址:GitCode - 全球开发者的开源社区,开源代码托管平台 使用 ZED 立体相机与 OpenCV 进行图像处理和深度感知 • 使用 ZED 相机和 OpenCV 库捕获图像、深度图和点云。 • 提供保存并排图像、深度图和点云的功能。 • 允许在不同格式之间切换保存的深度图和点云…

Nacos 3.0 考虑升级到 Spring Boot 3 + JDK 17 了!

Nacos 由阿里开源,是 Spring Cloud Alibaba 中的一个重要组件,主要用于发现、配置和管理微服务。 由于 Spring Boot 2 的维护已于近期停止,Nacos 团队考虑升级到 Spring Boot 3 JDK 17,目前正在征求意见和建议。 这其实是一件好…

(css)鼠标移入或点击改变背景图片

(css)鼠标移入或点击改变背景图片 html <div class"mapTip"><divv-for"(item, index) of legendList":key"index"class"mapTipOne":class"{ active: change index }"click"legendHandle(item, index)"…

Grad-CAM-模型可视化分析方法

模型的可视化分析对于理解模型的行为有很好的辅助作用&#xff0c;能够让人们更容易理解神经网络的决策过程。 Grad-CAM&#xff08;Gradient-weighted Class Activation Mapping&#xff09;是一种用于解释卷积神经网络&#xff08;CNN&#xff09;决策过程的方法&#xff0c;…

常见八股文03

35.autowired、qualifier和Resource区别 Autowired&#xff1a;基于类型的注入 Qualifier&#xff1a;基于名称进行注入 Resource:按名称装配注入&#xff0c;如果找不到与名称匹配的bean&#xff0c;则按类型装配注入&#xff0c;可以用于字段和方法上 36.代理模式 动态代…

Pytorch | 利用NI-FGSM针对CIFAR10上的ResNet分类器进行对抗攻击

Pytorch | 利用NI-FGSM针对CIFAR10上的ResNet分类器进行对抗攻击 CIFAR数据集NI-FGSM介绍背景算法流程 NI-FGSM代码实现NI-FGSM算法实现攻击效果 代码汇总nifgsm.pytrain.pyadvtest.py 之前已经针对CIFAR10训练了多种分类器&#xff1a; Pytorch | 从零构建AlexNet对CIFAR10进行…

redis开发与运维-redis02-redis数据类型与命令总结

文章目录 【README】【1】redis通用命令与数据结构【1.1】通用命令【1.2】数据结构与内部编码【1.3】redis单线程架构【1.3.1】redis单线程优缺点 【2】字符串&#xff08;值的类型为字符串&#xff09;【2.1】常用命令【2.1.1】设置值【2.1.2】获取值【2.1.3】批量设置值【2.1…

机器学习《西瓜书》学习笔记《待续》

如果说&#xff0c;计算机科学是研究关于“算法”的学问&#xff0c;那么机器学习就是研究关于“学习算法”的学问。 目录 绪论引言基本术语 扩展向量的张成-span使用Markdown语法编写数学公式希腊字母的LaTex语法插入一些数学的结构插入定界符插入一些可变大小的符号插入一些函…

电脑开机提示error loading operating system怎么修复?

前一天电脑还能正常运行&#xff0c;但今天启动时却显示“Error loading operating system”&#xff08;加载操作系统错误&#xff09;。我已经仔细检查了硬盘、接线、内存、CPU和电源&#xff0c;确认这些硬件都没有问题。硬盘在其他电脑上可以正常使用&#xff0c;说明不是硬…

git企业开发的相关理论(一)

目录 一.初识git 二.git的安装 三.初始化/创建本地仓库 四.配置用户设置/配置本地仓库 五.认识工作区、暂存区、版本库 六.添加文件__场景一 七.查看 .git 文件/添加到本地仓库后.git中发生的变化 1.执行git add后的变化 index文件&#xff08;暂存区&#xff09; lo…

Linux网络——网络基础

Linux网络——网络基础 文章目录 Linux网络——网络基础一、计算机网络的发展背景1、网络的定义&#xff08;1&#xff09; 独立模式&#xff08;2&#xff09;网络互联 2、局域网 LAN3、广域网 WAN4、比较局域网和广域网5、扩展 —— 域域网和互联网 二、协议1、协议的概念2、…

react中实现导出excel文件

react中实现导出excel文件 一、安装依赖二、实现导出功能三、自定义列标题四、设置列宽度五、样式优化1、安装扩展库2、设置样式3、扩展样式功能 在 React 项目中实现点击按钮后导出数据为 Excel 文件&#xff0c;可以使用 xlsx 和 file-saver 这两个库。 一、安装依赖 在项目…

7-Zip 加密功能使用教程:如何设置密码保护压缩文件

压缩包如何加密&#xff1f;7-Zip 是一款开源的文件归档工具&#xff0c;支持多种压缩格式&#xff0c;并提供了对压缩文件进行加密的功能。使用 7-Zip 可以轻松创建和解压 .7z、.zip 等格式的压缩文件&#xff0c;并且可以通过设置密码来保护压缩包中的数据不被未授权访问。 准…

[计算机网络]ARP协议的故事:小明找小红的奇妙旅程

1.ARP小故事 在一个繁忙的网络世界中&#xff0c;每个设备都有自己的身份标识——MAC地址&#xff0c;就像每个人的身份证号码一样。在这个故事里&#xff0c;我们的主角小明&#xff08;主机&#xff09;需要找到小红&#xff08;目标主机&#xff09;的MAC地址&#xff0c;才…

新版国标GB28181设备端Android版EasyGBD支持国标GB28181-2022,支持语音对讲,支持位置上报,开源在Github

经过近3个月的迭代开发&#xff0c;新版本的国标GB28181设备端EasyGBD安卓Android版终于在昨天发布到Github了&#xff0c;最新的EasyGBD支持了国标GB28181-2022版&#xff0c;还支持了语音对讲、位置上报、本地录像等功能&#xff0c;比原有GB28181-2016版的EasyGBD更加高效、…

McDonald‘s Event-Driven Architecture 麦当劳事件驱动架构

原文链接 1 mcdonalds-technical-blog/ 原文链接 2 mcdonalds-technical-blog/ 麦当劳在异步、事务性和分析性处理用例中使用跨技术栈的事件&#xff0c;包括移动订单进度跟踪和向客户发送营销通信&#xff08;交易和促销&#xff09;。 统一事件平台&#xff08;unified eve…

【CSS in Depth 2 精译_089】15.2:CSS 过渡特效中的定时函数

当前内容所在位置&#xff08;可进入专栏查看其他译好的章节内容&#xff09; 第五部分 添加动效 ✔️【第 15 章 过渡】 ✔️ 15.1 状态间的由此及彼15.2 定时函数 ✔️ 15.2.1 定制贝塞尔曲线 ✔️15.2.2 阶跃 ✔️ 15.3 非动画属性 文章目录 15.2 定时函数 Timing function…

一个开源的自托管虚拟浏览器项目,支持在安全、私密的环境中使用浏览器

大家好&#xff0c;今天给大家分享一个开源的自托管虚拟浏览器项目Neko&#xff0c;旨在利用 WebRTC 技术在 Docker 容器中运行虚拟浏览器&#xff0c;为用户提供安全、私密且多功能的浏览体验。 项目介绍 Neko利用 WebRTC 技术在 Docker 容器中运行虚拟浏览器&#xff0c;提供…