DeepFM - 工业界经典baseline(哈工大 华为)

news2024/11/18 12:48:29

文章目录

  • 1、模型结构如下:
  • 2、关键理解点:
  • 3、代码实现细节:

  • DeepFM: A Factorization-Machine based Neural Network for CTR Prediction。
  • dfm由哈工大和华为合作发表在IJCAI-2017;模型结构很简单,wide&deep结构。

1、模型结构如下:

在这里插入图片描述

相比wide&deep [下文简称wd] 有如下创新与改进:

  • wide端采用FM [deep端不变],显式自动构造二阶特征。而wd中采用LR,需要人工构造交叉特征,这种方式需要两个特征共现,否则其权重无法训练。
  • dfm中,fm与dnn共享底层embedding向量,这种方式也更符合现在推荐/广告领域里多任务模型多塔共享底层embedding的方式,然后end-to-end训练得到的embedding向量也更加准确。
    deep端 - DNN:
  • 所有不同field的特征的embedding做concat输入dnn。
  • 代码可这样
deep_output &

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/541891.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

就业内推 | 应届生校招、实习,上市公司有岗,最高18k*15薪

01 UCloud 🔷招聘岗位:网络工程师 🔷职责描述: 1、负责UCloud全球骨干网或数据中心网络工作,包括设备技术选型、架构运营方案设计、日常运维支持 2、持续提升网络稳定性与性能。 🔷任职要求: …

Flowable-modeler可视化教程

Flowable-Modeler功能 提供可视化编辑器,编辑BPMN流程,编辑CASE模型,编辑Form表单,编辑App应用,编辑决策表提供可视化参数配置:每个流程可以配置详细的参数设置,按照流程对应的规范来设计。提供…

学Python的都在说爬虫容易进去,你还敢做爬虫吗?十分钟带你规避可拷风险

阅读文本大概需要 10 分钟,今天,不要面向监狱编程了。 序言 前段时间有一篇名为《只因写了一段爬虫,公司200多人被抓!》的文章非常火,相信大家应该都看到了。 这篇文章火起来之后,本来经过了一个多月的时…

【Spring框架】--01.Spring概述、入门

文章目录 Spring1.概述1.1Spring是什么?1.2 Spring 的狭义和广义1.3 Spring Framework特点1.4 Spring模块组成1.5 Spring6特点1.5.1版本要求 2.入门2.1 构建模块2.2 程序开发2.2.1 引入依赖2.3.2 创建java类2.3.3 创建配置文件2.3.4 创建测试类测试2.3.5 运行测试程…

centos上搭建redis伪集群

1.安装ruby 搭建redis集群需要ruby脚本,需要安装ruby的环境 (1)yum install ruby (2) yum install rubygems 2. 复制安装完成的redis /usr/local目录下创建redis-cluster目录,复制已经安装完成的redis到 /usr/local/redis-cluster/redis01目录&#x…

京东软件测试岗位经典面试题(附答案)

1、黑盒测试的测试用例常见设计方法都有哪些?请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。 1)等价类划分:等价类是指某个输入域的子集合.在该子集合中,各个输入数据对于揭露程序中的错误都是等效的.并合理地假…

【从零开始写视觉SLAM】v0.1基于特征点的简单VO

v0.1版本的oSLAM实现了基于orb特征点的简单视觉里程计,通过连续两帧的rgbd数据实现相机相对位姿的估计。 #mermaid-svg-ibQfHFVHezQD5RWW {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-ibQfHFVHezQD5RW…

MySQL数据库---笔记1

MySQL数据库---笔记1 一、数据库概述1.1、什么是数据库1.2、数据库的安装与启动1.3、MySQL数据模型 二、SQL2.1、通用语法及分类2.2、DDL2.2.1、数据库操作 一、数据库概述 1.1、什么是数据库 名称全称简称数据库存储数据的仓库,数据是有组织的进行存储DataBase (…

LeetCode每日一题之二分搜索

文章目录 1.关于二分搜索常见的误区2.左闭右闭区间的写法3.左闭右开区间的写法4.找到第一个大于target的数5.找到第一个小于target的数6.找到第一个大于等于taregt的数7.找到第一个小于等于target的数 1.关于二分搜索常见的误区 区间的定义: 2.左闭右闭区间的写法…

(MIT6.045)自动机、可计算性和复杂性-正则表达式

语言(language)的计算性质:交、并、补、反转、拼接、星号(*) 星号是一元运算符,表示一个语言和自己的有穷次笛卡尔积。 回顾:正则语言(Regular Language)指可以用DFA描述的语言。 正则表达式…

Linux内核panic简析

源码基于:Linux 5.4 0. 前言 内核异常的级别大致分为三个:BUG、oops、panic。 BUG 是指那些不符合内核的正常设计,但内核能够检测出来并且对系统运行不会产生影响的问题,比如在原子上下文中休眠,在内核中用 BUG 标识。…

Linux——线程3|线程互斥和同步

加锁保护 我们上一篇提到过,多个线程执行下面代码可能会出错,具体原因可查看上一篇Linux博客。

Vue3相关知识点笔记(持续更新中。。。。)

目录标题 1、Vue3中的组合式Api有哪些? 和Vue2的Options Api有什么不同?Vue3中的组合式API主要包括以下几个:与Vue2的option Api有什么不同 2、Vue3.0的设计目标是什么?做了哪些优化?设计目标是什么?哪些优化? 3、Vu…

python:随机森林分类器的性能评估(决策树数量的影响)

作者:CSDN @ _养乐多_ 随机森林(Random Forest)是一种强大的机器学习算法,常用于分类和回归任务。它由多个决策树构成,通过集成学习的方式进行预测。在本篇博客中,我们将探讨随机森林分类器在不同决策树数量下的性能,并绘制相应的图表进行可视化分析。OOB误差,0被误判为…

C++ 实现堆排序

时空复杂度 时间复杂度 排序复杂度 O ( n l o g n ) O(nlogn) O(nlogn) 建堆复杂度 O ( n ) O(n) O(n) 空间复杂度 由于堆排序是一种就地设计的排序算法,空间需求是恒定的,所以是O(1) 稳定性 不稳定。 C代码(大根堆) cla…

Jenkins持续集成之修改jenkins工作目录

修改jenkins工作目录 一般不建议把工作目录放到默认的C盘,故可以更改到其他盘中 前置条件:先在其他盘中新建工作目录的文件;如下图 1、首先打开任务管理器,找到服务中的Jenkins进程 2、右击点击转到详细信息; 3、再右…

洛谷P1706全排列问题题解(两种方法+详解)

问题引出 全排列问题 题目描述 按照字典序输出自然数 1 1 1 到 n n n 所有不重复的排列,即 n n n 的全排列,要求所产生的任一数字序列中不允许出现重复的数字。 输入格式 一个整数 n n n。 输出格式 由 1 ∼ n 1 \sim n 1∼n 组成的所有不重…

成为Jmeter大师:从入门到精通的环境搭建教程

一、JMeter 介绍 Apache JMeter是100%纯JAVA桌面应用程序,被设计为用于测试客户端/服务端结构的软件(例如web应用程序)。它可以用来测试静态和动态资源的性能,例如:静态文件,Java Servlet,CGI Scripts,Java Object,数据库和FTP服…

什么是 http 代理,为什么需要 http 代理?

前言: 在我们进行软件测试工作的时候,会有很多地方需要去设置代理的。 比如:fiddler抓包,jmeter录制脚本等等。 甚至于,在某些公司,去访问某些内部网址的时候,都需要通过连接vpn才能成功访问。…

Meaning of life :Do not wait too long and miss the opportunity

生命的意义在于机会在眼前,我们就要去抓住他,错过了可能会遗憾终身,不要去等待机会的到来,很多时候真是应一句老话, "机不可失时不再来!" 。 Dont wait too long and miss the opportunity Each spring brings a blos…