首页HF粗排模型优化

news2025/1/24 5:32:57

[work@ rus_env]$ pwd
/home/work/xx/du-rus/offline-tools/du_rus/rus_env

[work@ rus_env]$

python buildenv_rus.py  5a0e771e938a486df3b8b3e1cde1a39c2006882d 5f3241963a3e39a8e1eae05d7075fc5b9278a7c7

打开日志级别

[work@xx conf]$

vim /home/work/xx/du-rus/du_rus_offline/conf/log.conf

第31行rpc.log 追加,TRACE,DEBUG

     31 RPC_SELFLEVEL : NOTICE,TRACE,DEBUG

重启服务

/home/work/xx/du-rus/du_rus_offline/bin

./server_control stop  暂停服务

./server_control start  启动服务

小流量

模型预测:506987_507013

recaller分布不变:507017_507013

source_type分布不变:506985_507013

recaller_source_type分布不变:507016_507013

对照组:507013

模块验证

前置规则(pre_process)

  1. debug信息
    postman连接测试环境,请求体中isDebug设置为true,在response中搜索homefeed_items_feature

[work@nj02-ps-wwwda13-n1.nj02.baidu.com log]$ vim /home/work/xx/du-rus/du_rus_offline/log/rpc.log

日志查询  

模型预测

 1. 无法排序资源跳过模型预测
小流量输入506987_507013
postman连接测试环境,日志中搜索"before extract_specific_sourcetype_cands cands len is" → A   日志结果为579

  

2. 日志中搜索"after extract_specific_sourcetype_cands cands len is" → B  日志结果为537

3. 日志中搜索"target_cands len is" → C
必须保证A-B=C

  


且资源的source_type为vod和news是会跳过预测,即这两种情况下日志中会出现"this item has been move to target_cands"

​4. 模型预测
小流量输入506987_507013
日志中
不会出现"model_manager->regress fail"
日志中搜索"candidate_id:"查看每个candidate的打分


排序

1. 基于模型预测/recaller分布不变的结果排序(单纯按照分数排序)小流量输入模型预测对应小流量506987_507013,查看排序前candidates

日志搜索"pre rough_ranking is"分数无序​

日志搜索"post rough_ranking is",分数一定是降序排序

2. 基于recaller_source_type分布不变507017_507013的结果排序(同recaller+source_type下的资源进行排序)

流量输入模型预测对应小流量,查看排序前candidates,日志搜索"pre rough_ranking is",同上
分数无序

日志搜索"post rough_ranking is",对应排序前和排序后资源的排序方式是同recaller+source_type下的排序
分数降序

3. 基于source_type分布不变506985_507013的结果排序(根据recaller_min_quota_conf读取每个recaller quota,保证quota内资源排序前后source_type分布不变)

小流量输入模型预测对应小流量,日志中搜索"cands len is",即输入排序模块的Candidate个数

日志中搜索"global_source_type_distribution is",查看排序前topk资源的分布

日志中搜索"top_reserve_num_candidates len is",查看排序后资源数量总和,一定保证总和和上面topk资源数量总和相同

4. 日志中搜索"check_source_type_distribution is",查看排序后topk资源的source_type分布,一定保证和排序前topk资源的分布是相同的
 

quota

1. 基于模型预测/source_type分布不变的quota配置
小流量输入模型预测对应小流量506987_507013,日志中搜索不到"in select_topk"

2. 基于recaller分布不变/recaller_source_type分布不变的quota配置   
小流量输入模型预测对应小流量,日志中搜索到"in select_topk"

测试结论

通过

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1556285.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

线程中的核心操作

线程中的核心操作 1:start()2:中断(终止)一个线程2.1:自己定义线程结束的代码2.1.1 存在的问题 2.2:使用Thread提供的interrupt()方法和isInterrupted()2.2.1 继续执行2.2.2 立即结束2.2.3 打印异常信息,再立即结束2.2.1 继续执行 22三级目录 1:start() start() 真正的创建线程…

LeetCode Python - 80. 删除有序数组中的重复项 II

目录 题目描述解法运行结果 题目描述 给你一个有序数组 nums ,请你 原地 删除重复出现的元素,使得出现次数超过两次的元素只出现两次 ,返回删除后数组的新长度。 不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O…

奔赴智慧医院建设浪潮,迈瑞创新产品亮相中国医学装备大会

3月28日,第32届中国医学装备大会暨2024医学装备展览会在重庆顺利开展。迈瑞医疗以“助力医院高质量发展,共建智慧医院生态”为主题参展,多款核心零部件、创新产品及智慧医疗生态集体亮相。 满足需求,推动智慧医院建设提速 迈瑞医疗…

天下三分明月夜,独有快慢指针法(链表面试题篇)

本篇会加入个人的所谓‘鱼式疯言’ ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. 🤭🤭🤭可能说的不是那么严谨.但小编初心是能让更多人…

什么是CVE? CVE漏洞应该如何防护?

CVE(Common Vulnerabilities and Exposures)的全称是公共漏洞和暴露,是公开披露的网络安全漏洞列表。IT人员、安全研究人员查阅CVE获取漏洞的详细信息,进而根据漏洞评分确定漏洞解决的优先级。 在CVE中,每个漏洞按CVE-…

Type-C一分二快充线智能分配方案

随着移动设备的普及和快充技术的迅猛发展,Type-C接口已成为众多手机、平板和笔记本电脑的标配。然而,在日常使用中,我们经常会遇到需要同时为多个设备充电的情况。这时,Type-C一分二快充线就显得尤为重要。为了更好地满足用户的充…

CSS之动画

一,动画的制作 实现盒子绕圈走 二, 动画的常用属性 三,动画简写属性 前面两个属性一定要写,第三个linear是指匀速的意思(默认是ease)

Day26 手撕各种集合底层源码(一)

Day26 手撕各种集合底层源码(一) 一、手撕ArrayList底层源码 1、概念: ArrayList的底层实现是基于数组的动态扩容结构。 2、思路: 1.研究继承关系 2.研究属性 3.理解创建集合的过程 – 构造方法的底层原理 4.研究添加元素的过程…

【Linux】图文详解Xshell远程连接服务器:以Amazon EC2 VPS为例

文章目录 问题描述解决方案Q&A 问题描述 本地cmd或powershell使用ssh -i “your.pem” user_nameip_address是可以登录Amazon EC2云服务器的。 然而,当使用XShell以SSH加载PEM文件方式登录亚马逊EC2云服务器,一直出现输入密码的问题,如…

FPGA亚稳态学习总结

首先是组合逻辑电路考虑的是竞争冒险,冒险会产生毛刺。重点研究如何去毛刺 时序逻辑电路考虑的是时序不满足会产生的亚稳态问题:如何考量时序满不满足呢?根据不同的场景又有不同的说法。 时序分析的两组基本概念 建立时间与保持时间 1.在…

使用Node.js常用命令提高开发效率

Node.js是一个基于Chrome V8引擎的JavaScript运行时环境,广泛用于构建服务器端应用程序和命令行工具。Node.js提供了丰富的命令和工具,可以帮助开发者更高效地开发应用程序。在日常开发中,除了Node.js本身的核心功能外,npm&#x…

加密/ 解密 PDF:使用Python为PDF文档设置、移除密码

在数字化时代,文档的安全性变得越来越重要。特别是对于包含敏感信息的PDF文件,确保其不被未经授权的人员访问或修改是至关重要的。本文将介绍如何使用Python在PDF文档中设置密码,以及如何移除已经设置的密码。 目录 PDF加密基础知识 Pytho…

QT 最近使用的项目配置文件

目录 1 QT 最近使用的项目配置文件所在路径 2 QtCreator.ini 1 QT 最近使用的项目配置文件所在路径 C:\Users\your username\AppData\Roaming\QtProject QtCreator.ini最好先备份一份 2 QtCreator.ini ProjectExplorer 下面的 RecentProjects\FileNames RecentProjects\…

【公示】2023年度青岛市级科技企业孵化器拟认定名单

根据《青岛市科技企业孵化器管理办法》(青科规〔2023〕1号)(以下简称《管理办法》)、《关于开展2023年度市级科技企业孵化器认定申报工作的通知》,经申报受理、区市推荐、形式审查、专家评审及现场核查等程序&#xff…

十七、InnoDB 一次更新事务的执行过程

一、InnoDB的一次更新事务是怎么实现的? InnoDB的一次更新事务涉及到多个组件和步骤,包括Buffer Pool、BinLog、UndoLog、RedoLog以及物理磁盘。 下面是一次完整的事务更新操作过程: 1. 加载数据到缓存中(Buffer Pool&#xff0…

HTML5通过api实现拖放效果 dataTransfer对象

dataTransfer对象 说明:dataTransfer对象用于从被拖动元素向放置目标传递字符串数据。因为这个对象是 event 的属性,所以在拖放事件的事件处理程序外部无法访问 dataTransfer。在事件处理程序内部,可以使用这个对象的属性和方法实现拖放功能…

【实现报告】学生信息管理系统(链表实现)

目录 实验一 线性表的基本操作 一、实验目的 二、实验内容 三、实验提示 四、实验要求 五、实验代码如下: (一)链表的构建及初始化 学生信息结构体定义 定义元素类型 链表节点结构体定义 初始化链表 (二)…

【AI】命令行调用大模型

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 【AI】命令行调用大模型引入正文初始化项目撰写脚本全局安装 成果展示 【AI】命令…

Linux——共享内存

Linux——共享内存 什么是共享内存共享内存原理Linux下共享内存的接口创建/获取共享内存:shmgetftok函数 映射共享内存到进程地址空间:shmat 解除共享内存映射:shmdt删除共享内存段:shmctl 利用共享内存进行通信 我们之前学习了匿…

香港服务器怎么看是CN2 GT线路还是CN2 GIA线路?

不知道有没有小伙伴们注意过,很多人在租用香港服务器的时候都习惯性选择 CN2 线路?仿佛香港服务器是否采用 CN2 线路成为个人企业选择香港服务器的一个标准。其实,香港服务器有CN2、优化直连(163)、BGP多线(包含了国际和国内线路)&#xff0c…