看火山引擎DataLeap如何做好电商治理(二):案例分析与解决方案

news2024/11/15 8:38:59

接上篇,以短视频优质项目为例,火山引擎DataLeap平台治理团队会去对每天发布的这种挂购物车车短视频打上标签,识别这些短视频它是优质的还是低质的,以及具体原因。一个视频经过这个模型识别之后,会给到奖惩中心去做相应的奖惩策略。简单来说,如果它是优质视频,会去做这种流量的扶持,是低质,直接通过奖惩中心去做这种流量的打压。

算法开发阶段,数据预处理产出训练数据集

以前因为模型的测试集量级很大,处理起来会很慢,平台治理团队现在使用 火山引擎DataLeap的 Notebook 任务,做这种数据的一些预处理。在预处理完这些数据之后会把数据放到 Hive 表,或者是放到 HDFS 上面去,这些数据在HDFS上可以设置长久保存。这就很好的满足了在实际应用场景中需要收集很长一段数据的需求,不必受存储的有效期只有 7 天时间的限制。

 (图:DataLeap数据开发平台)

之后平台治理团队再离线地去处理这些数据,产出训练集合,比如把在 HDFS 上存储的路径下载到自己的的开发机里面,就可以去进行模型训练了。因为Notebook任务可以支持任务的每天运行,不必人工去搭建Notebook环境去训练数据,这样可以大大节省人力成本,提升数据处理和统计效率。

算法上线,验证模型效果

训练好了模型,需要去评估它的效果好不好,这个时候我们通过火山引擎DataLeap把线上的Kafka数据写到 Hive 里面,再离线地分析对应的落的 Hive 表来看模型的效果是怎么样的,发现有哪些是漏放,有哪些是误伤等等不同的模型平台治理团队看的指标不一样,通常的话主要看准确和召回,还会看一些比如说 AUC 或者是 ACC 这样的一些数据,总的来说不同的模型关注的指标是不太一样的。

风神Aeolus)结合,进行监控看板的搭建

关于如何做好监控,可以与Aeolus结合搭建监控看板,具体来看通过火山引擎DataLeap hsql任务分析这种落好的 Hive 表,然后产出统计指标(比如召回率 漏放率 审出率 驳回率 ),把指标做成数据集,在Aeolus上面去建立这样的一些看板。这种看板每天也能够例行的给到监控人员一些结果,对于上线之后的数据监控是有极大帮助的。同时也会对badcase,进行深入的分析,进而优化算法模型。

平台治理效果

据了解,火山引擎DataLeap平台治理团队去年全年累计挖掘优质短视频超147万条,助力超26万名电商作者平均流量增长56%;累计处罚违规低质短视频超3280万条、违规低质直播超1500万场。整体内容质量有明显改观,消费者好感度上升7.2%。

此外,平台还持续强化直播内容真实可信,通过构建商品信息清晰、真实可信的直播生态,规范达人带货行为。882名电商作者因在直播中虚假营销受罚,消费者推荐度提升11.85%。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/505282.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

聊一聊 用 dotnet-trace 调查 lock锁竞争

一:背景 1. 讲故事 最近在分析一个 linux 上的 dump,最后的诱因是大量的lock锁诱发的高频上下文切换,虽然问题告一段落,但我还想知道一点信息,所谓的高频到底有多高频?锁竞争到底是一个怎样的锁竞争&…

将训练好的模型保存在服务端的三种办法

刚刚在完善我书中第七章案例的文档时,需要将训练好的模型存储在服务端,方便小伙伴们来使用该模型,这里我提供三种办法: 直接从我的个人网站中加载;通过python启动一个文件下载服务器;使用微信小程序云存储…

windows10+detectron2完美安装教程

文章目录 前言下载detectron2安装Visual Studio 2019修改代码 前言 需要下载detectron2的github项目,安装vs2019 (强烈建议这个版本,其他的版本需要做更多地操作才能成功安装),默认其他环境没问题。 下载detectron2 链接:https…

【来点小剧场--爪哇岛寻宝】java实现网络编程,写一个简易的回显服务程序

作者:困了电视剧 专栏:《JavaEE初阶》 文章分布:这是一篇关于网络编程的文章,在这篇文章中我会剖析一段回显服务程序的执行步骤和代码编程,希望对你有所帮助! 目录 客户端 服务端 总结 客户端 现在我们…

Postman完全卸载步骤

一、卸载应用程序 我们首先正常右键点击卸载通过windows程序卸载功能来卸载postman应用程序。 二、删除文件 (1)删除AppData》Roadming下的postman文件夹 (2)删除AppData》Roadming》\Microsoft\Windows\Start Menu\Programs下的p…

态势感知与信质、信量

未来的新智能是人机环境系统智能,而人机融合的态势感知是其关键,简单地说,态势感知(situation awareness)就是智能体在“一定时间和空间环境中的元素的感知,对它们的含义的理解,并对他们稍后状态…

uni——调用子组件失败解决方法($nextTick)

案例说明 调用子组件内的方法或者属性赋值报错的 this.$refs.goodsOrder.list [ ]解决代码 在外层包裹this.$nextTick(() > { 数据 }) this.$nextTick(() > {this.$refs.goodsOrder.list [] })

【JAVA面试】JVM

提示:文章先作为初版,等后续时间充足后,补充更深的内容 文章目录 JVM一、垃圾回收算法二、什么是STW三、JVM参数四、JVM内存模型 JVM 一、垃圾回收算法 JVM中的垃圾回收算法可以分为两种类型:基于引用计数的垃圾回收算法和基于可…

国考省考行测:数字推理题,趋势平缓作差,趋势陡峭看平方乘积,根号数列平方,分数小数拆开看

国考省考行测:数字推理题,趋势平缓作差,趋势陡峭看平方乘积,根号数列平方,分数小数拆开看 2022找工作是学历、能力和运气的超强结合体! 公务员特招重点就是专业技能,附带行测和申论,而常规国考…

【Unity3D】Shader变体管理流程-变体剔除

一、什么是Shader变体管理 想要回答这个问题,要看看什么是Shader变体。 1. 变体 我们用ShaderLab编写Unity中的Shader,当我们需要让Shader同时满足多个需求,例如说,这个是否支持阴影,此时就需要加keyword(…

强化学习p1-基本概念

Terminologies(名词) 状态(State) 每个时刻,环境有一个状态 (state),可以理解为对当前时刻环境的概括 状态(State) 有时也被称为观测(Observation),因为有时智能体并不能观测到环境改变后的全部,只能观测到部分。 环境(Environm…

计算机毕业论文内容参考|软件工程|网络流量异常信息分析方法研究

文章目录 导文文章重点摘要前言绪论课题背景国内外现状与趋势课题内容相关技术与方法介绍技术分析技术设计技术实现总结与展望导文 网络流量异常信息分析方法研究 文章重点 摘要 本课题针对网络安全中网络流量异常的分析方法进行研究,提出一种基于机器学习和深度学习的异常检…

OpenCV教程——处理图像像素及图像掩膜

1.像素值 像素值是图像被数字化时由计算机赋予的值,代表了图像中某一小方块(即【像素点】)的平均亮度信息。 灰度图像通常用8位表示一个像素,这样总共有256个灰度等级(像素值在0~255之间)。 …

最值得推荐的免费分区管理软件

磁盘管理是 Windows 的内置工具,用于操作硬盘上的分区,但自 Windows XP 以来直到Windowa11 该程序几乎没有变化。个人测试了五个备选方案,以了解它们之间的比较。 奇客分区 默认的分区个数根据磁盘大小?需要重新划分分区&#xf…

2023/5/8总结

JAVA基础知识(2) 1.方法 1、方法定义 格式:public static void 方法名(){ //方法体 } 2、方法调用 格式:方法名(); 3、方法的通用格式 public static 返回值类型方法名&…

Camtasia2023官方中文版免费下载

在现在的网络互联网时代,越来越多的人走上了自媒体的道路。有些自媒体人会自己在网络上录制精彩视频,也有一些人会将精彩、热门的电影剪辑出来再加上自己给它的配音,做成大家喜欢看的电影剪辑片段。相信不管大家是自己平时有独特的爱好也好、…

【机组组合】基于数据驱动的模型预测控制电力系统机组组合优化【IEEE24节点】(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

MySQL ---- 事务

事务 1、事务简介 事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撒销操作请求,即这些操作要么同时成功,要么同时失败。 在实际的开发过程中,一个业务操作如&am…

如何创建可引导的 ESXi USB 安装介质 (macOS, Linux, Windows)

如何创建可引导的 ESXi USB 安装介质 (macOS, Linux, Windows) 如何制作 ESXi USB 启动盘 请访问原文链接:https://sysin.org/blog/create-bootable-esxi-usb-installer/,查看最新版。原创作品,转载请保留出处。 作者主页:sysi…

第四十六章 Unity 布局(上)

学习了UI元素的使用,并不能构建出一个完整的UI界面,我们需要使用一些方法将这些UI元素按照“设计稿”的效果,将其摆放到对应的位置上。如何摆放这些UI元素,就是我们需要讲的“布局”,当然这需要借助一些布局组件来完成…