音乐推荐系统设计

news2025/1/18 11:46:25

文章目录

    • 问题描述
    • 如何解决
    • 系统设计
    • 评测指标
    • 推荐系统的用户画像
      • 运动音乐场景用户行为分析
      • 睡眠音乐场景用户行为分析
      • 治愈音乐场景用户行为分析
      • 其他音乐场景用户行为分析

问题描述

移动网络和数字多媒体技术的飞速发展促进了数字音乐产业的共享与广泛传播.对用户而言,在海量的音乐库中寻找个人喜欢的音乐需要花费大量的时间和精力。音乐推荐系统的目的是将用户从这项繁琐的工作中解脱出来,从而有效地提高用户体验,为音乐平台创造经济收益。使用基于协同过滤的经典推荐算法,如矩阵因子分解方法,其数据的来源是用户的历史交互数据。协同过滤的应用非常广泛,但同时也面临着数据稀疏和冷启动等问题,同时,由于协同过滤的模型所限,在特征提取方面存在着很多不足,从而会限制推荐系统的准确率。

如何解决

音乐作为一种艺术形式,吸引用户、与用户产生共鸣的因素有很多,其中最重要的就是音频本身的特征,如场景、语言、旋律、乐器、流派、歌词和音乐人等。因此,根据音频本身来进行推荐,推荐效果会更加精准。
音频内容本身包含着吸引用户的特征,如节奏、旋律和乐器等影响用户偏好的因素,因此,有效提取出对用户产生吸引的本质特征是重中之重。使用基于内容的推荐,通过音频处理方法(如离散傅里叶变换)等方法处理音频数据来提取特征,其中涉及一些常用的音乐特征参数,包括频率中心、短时平均能量、过零率、梅尔频率倒谱系数及带宽等。

系统设计

实现基于内容的音乐推荐主要分为以下四个部分:
(1)绘制用户画像,用户画像包括用户的年龄、性别、国籍、听歌偏好及与系统的交互信息等;
(2)将音乐embedding为相应的特征向量;
(3)按选定的推荐方法生成候选集;
(4)将用户画像、音乐的特征向量按照推荐方法建模,在候选集中以TopN的方式为用户推荐相似度高的音乐列表。
用户画像是用户信息的数据化,其目的是为了更加贴合用户的喜好和使用习惯,用户画像也与用户所处情境密切相关。为了更加准确地描绘出音乐作品,第一步需要提取尽可能多的会影响用户偏好的特征,使得推荐更加符合用户需求.音频形式可以通过卷积神经网络来提取特征,这部分就是特征工程,特征工程的目的就是将音频embedding为特征向量;第二步是生成候选集,这一步的目的在于简化处理问题的规模,在保证推荐效果的前提下减小计算量;第三步是排序,排序需要用到前两步的结果,利用用户画像及音频的特征向量作为排序的依据,以用户交互数据来训练回归模型.文献[28]提出了一种潜在因素模型,该模型通过滤波器组处理音频,滤波器通过卷积神经网络提取梅尔频谱系数。梅尔频谱系数是可以用于表示人的听觉效应的特征,基于梅尔频谱特征建模可以学习到潜在的与用户偏好相关的特征,并证明了使用潜在特征可以给出相比于协同过滤更加明确的推荐,而且在一定程度上克服了冷启动的问题.因此,梅尔频谱系数广泛应用于音频信息分析等领域口。文献[31]提出另外一种重要的音频特征—色度向量,可用于判断音阶,从而使推荐效果更加精准。
基于内容推荐的优势在于推荐的依据来源于物品的本身属性,可以有效地避免冷启动和长尾效应问题,推荐准确率也比传统的基于协同过滤算法的推荐系统高。但其面临着特征提取难度高、计算复杂、难以挖掘用户的潜在兴趣等问题。

评测指标

一般做法可以使用点击率、转化率、网站成交额和召回率度量推荐结果或者产生一个TopN推荐列表。这些评价指标本质上都是基于预测准确率。但是这样的系统的评测结构过于单一。针对这一问题,可以使用一些新的评测指标如新颖性以及惊喜度等.通过最优化其中一个评测指标,同时综合其他指标进行推荐,使得推荐效果更加符合用户需求。Celma曾提出流行度长尾尾部的音乐可能更加让用户觉得新颖。假设S表示用户集合,那么用户u的推荐列表的新颖性定义如下:
在这里插入图片描述

其中R是一个TopN函数,Ru,20表示把推荐列表中前20项推荐给用户u,popi表示对音乐偏好程度的预期。
文献提出用户需求还应包括意外和惊喜,并提出惊喜度以度量推荐者系统生成推荐列表的偶然性.惊喜度是指推荐结果与所使用的推荐方法得出的用户偏好不同,但用户对结果感到满意.一般通过Unserendipity来度量惊喜度,公式如下:
在这里插入图片描述

其中,cosSim(i,h)的值是指用户历史兴趣Hu。和新的推荐结果之间的平均相似度,表示推荐结果和用户历史兴趣的相似程度,相似程度越小,则推荐的惊喜度越大,Zhang等认为理想的推荐系统应模仿可信赖的朋友或专家的行为,并在此基础上提出了Aura- list推荐框架,在准确性、多样性、新颖性和偶然性等四个因素之间取得平衡。使用“偶然发现”的新颖性算法,演示了一种将偶然性、新颖性和多样性成功注人建议中的方法,同时限制了对准确性的影响.研究结果显示,Auralist框架对偶然性的重视提高了用户满意度。

推荐系统的用户画像

运动音乐场景用户行为分析

跑步和健身场景是绝对主流,不同运动偏好收听时长不同。在运动场景偏好上,跑步歌单渗透率高达49.9%。健身歌单也达到了43.0% ,而瑜伽歌单的渗透率则与前两者差距较大,仅有7.1%。具体分析用户的使用习惯可知.健身歌单的用户单次收听超3小时的占比达38.8%。跑步运动较为剧烈,因此超半数用户单次只收听1-2小时。而瑜伽运动由于其较为舒缓,单次收听在2-3小时区段内的人数较另外两个歌单更多。
男性更爱跑步歌单,瑜伽歌单受众群年龄更高。男性和女性在运动场景下的偏好有着明显的差异,男性更爱收听运动场景下的跑步歌单。而女性则偏好健身歌单。同时,在瑜伽歌单的用户分布上,女性愿意收听瑜伽歌单的比例明显要高于男性。在运动场景歌单用户年龄分布上,健身歌单和跑步歌单的用户群最多分布的年龄段是26-30岁,而瑜伽歌单的用户则更多分布在31-35岁之间。
在运动场景下用户最关注音乐的节奏感和舒适感。根据调研,对于运动场景用户而言,能够带来节奏能力是用户在选择场景音乐时最关注的因素.占比高达68.3%。同时,也有63.3%的用户认为运动场景音乐需要提供一个舒适的环境音乐 ,曲风符合当时心情,陪伴其运动过程从而提升运动效率。另外,由于运动健身场景的特殊性,用户对于操作简便、展现形式简单的需求度也比较高,达到了56.2%。
在进行有氧运动时爱听健身歌单,明显偏好节奏型音乐。在健身场景下,用户更偏好在进行有氧运动,热身放松等活动时收听健身场景音乐。对于所有的健身运动类型,能够给用户健身带来节奏感和能量,从而让用户在训练时更好的把握节奏感,是最受关注的因素,特别是对于Tebata、燃脂舞等强度较高的运动。除此之外,健身歌单用户认为音乐能够提供舒适环境音也是比较重要的一个因素,仅次于节奏感。
跑步场景用户最爱在独跑时收听,偏好舒适环境音类音乐。在跑步歌单的使用场景下,有69.6%的用户更偏好在单人独自跑步时收听音乐。而在多人合跑时使用跑步歌单的比例则下降至28.3%,可见在独自一人跑步时用户可能有更强的孤独感 ,因此更倾向于收听音乐陪伴。不同于健身场景的是,跑步作为一个相对比较舒缓的运动,大部分的跑步场景用户都认为音乐作为背景音能够提供舒适的环境音才是最重要的因素。
运动场景用户粘性高,偏好收藏与点赞的互动方式。在运动场景音乐的用户群中,单个用户听歌的频率往往较高,其中每天多次听歌的用户比例高达32.7%。用户平均每周听歌4-5次及以上的比例合计高达87.8% ,体现了整体.上运动歌单用户较高的粘性。在用户的互动习惯方面,整体上来看用户互动性较高,用户经常选择的互动方式最多的是收藏或点赞喜欢的音乐,比例分别为70.1%和65.0%。

睡眠音乐场景用户行为分析

睡眠场景用户偏好轻音乐,小众的脑波音乐受高薪人士偏爱。对于使用睡眠场景的用户而言,轻音乐内容形式(睡前助眠轻音、钢琴纯音乐、入眠音乐)更受欢迎。然而,在总体.上选择较少的Delta脑波及阿尔法脑波音乐,却更加受到高收入人群偏爱。脑波音乐作为一种比较新兴的音乐形式。在高收入人群中已经受到较多欢迎。未来,随着用户对脑波音乐的进一步认知,想必会有更多的用户接受这种音乐形式。
睡眠场景用户更期待音乐能提供平和的氛围。唾眠场景的用户更偏好于能够为其营造舒缓、平和的氛围感的音乐。调研中,有66.9%的用户都认为他们最看重的是睡眠场景音乐能用平顺的音色和节奏,让其进入最低活动状态,从而提升更好的睡眠质量这一点。 除此之外,也有64.5%的用户选择了希望睡眠场景音乐有舒缓作用。同时,也有较多用户偏好使用了自然采样的声音的音乐。
睡眠场景"强陪伴”属性,节假日入睡难更明显。睡眠场景下,用户粘性相较于更多用户每天多次收听的运动场景来说偏低,更多睡眠场景用户是每天收听一次。对于每天收听用户,单次使用时长也相对较长,有超40%用户表示单次使用3小时以上。调研发现,用户更偏好在夜间入睡前收听睡眠场景音乐, 21 : 00-24 : 00是最多用户收听的时段。而且在节假日,用户收听睡眠场景音乐的时段也会整体向后移动,节假日用户入睡难现象显著。

治愈音乐场景用户行为分析

疗愈场景用户最爱舒缓解压音乐,女性更信赖专业医生推荐。疗愈场景的用户总体.上来看,绝大多数用户都偏好舒缓解压类音乐,占比高达83.7%。且在总体上来看,女性更喜欢疗愈场景音乐,在疗愈场景具体的四种内容形式下,女性选择的比例都高于男性。专业医生推荐的疗愈音乐在总体上仅有59.4%的用户比较喜欢。但是,女性偏好.上明显高于男性,可见医生等专业人士的背书对女性来说有更大的作用。
用户最看重歌曲曲风轻松愉悦,更好达到解压作用。用户在选择疗愈场景音乐时最关注歌曲的曲风,其中用户最偏好的歌曲风格是轻松愉悦型,可以帮助其更好的达到解压作用。此外,温暖型的曲风,可以帮助用户舒缓情绪,也得到了较多用户选择。此外,歌单歌曲丰富性在疗愈场景下关注度高,达到63.5% ,作为对比,运动场景为54.8% ,唾眠场景为52% ,可以看出疗愈用户场景用户对歌单丰富性要求更高。
疗愈场景用户对内容质量最满意,女性对疗愈场景满意度高。依据疗愈场景下的用户反馈,用户最为满意的也是场景内容质量,达到4.29分,略低于睡眠场景下的用户满意度。具体来看,女性用户整体.上在五个指标维度给出5分满分的比例都要高于男性,特别是在场景内容时效性和场景内容作品题材两个指标上,男女性别之间给出的评分差距较大。

其他音乐场景用户行为分析

工作场景用户关注音乐是否让人静心,不同年龄偏好显差异。用户在工作场景之下收听音乐最关注的是音乐能够提供一个让人静心的氛围,从而可以不被外界所打扰。不同的年龄段对于工作场景下的音乐形式偏好有所不同, 46岁以上的用户明显偏好令人静心舒缓的音乐歌单;而对于26- 30岁的用户群体来说,他们最偏好的则是提神节奏型的歌单; 31-40岁年龄段的用户则都比较偏好可以提升专注度的音乐歌单。
车载场景下用户偏好自驾游音乐,看重歌曲能否带来轻松感。对于车载音乐场景音乐用户来说,大多数都更喜欢自驾游音乐相关歌单,此外也有60%以上的用户选择了驰骋音乐歌单和夜驾音乐歌单。在用户考量因素方面,用户最关注的因素是音乐歌单能否为用户带来轻松、舒畅的体验,从而舒缓堵车情况下的情绪,此外也有不少用户对歌曲能够扫清驾驶者的疲惫感,提升驾车专注度方面有所要求。
母婴场景用户最爱产后音乐,对其付费意愿较高。在母婴音乐场景之下,更多用户偏好产后音乐歌单,有超过70%的用户进行了选择。用户更看重母婴场景下的音乐是否能够帮助其调整情绪,使其拥有轻松愉快的心情。在付费意愿方面,产后音乐歌单也是拥有最多高付费意愿用户选择的一类,有高达62.8%的用户都表示非常愿意为产后音乐歌单付费,明显高于母婴场景下的其他歌单类型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/93439.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TensorRT框架解析

简介: 官网网址: Installation Guide :: NVIDIA Deep Learning TensorRT Documentation NVIDIA TensorRT 的核心是一个C库。 这有助于在 NVIDIA 图形处理单元 (GPU) 上进行高性能推理。 TensorRT 采用经过训练的网络&#xff0…

计算机毕设Python+Vue校园失物招领平台(程序+LW+部署)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

【2023程序员必看】人工智能行业分析

IT行业薪资高已成为大家的共识,但你知道哪个岗位薪资在IT行业中也是“高高在上”吗? IT届薪资天花板,人工智能当仁不让! 当下人工智能就业行情怎么样 22年毕业生春招就业情况 根据《2022年春招市场行情周报》显示,人…

【Git】拉取远程仓库的指定目录,图文详细步骤

Git概述 Git(读音为/gɪt/)是一个开源的分布式版本控制系统,可以有效、高速地处理从很小到非常大的项目版本管理。 也是Linus Torvalds为了帮助管理Linux内核开发而开发的一个开放源码的版本控制软件。 分布式相比于集中式的最大区别在于开发…

[附源码]Python计算机毕业设计个人博客Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等…

零碎知识点

零碎知识: 1.**在Python中表示乘方运算,**2即为求平方,**3表示3次方; 2.为赋值运算符,表示把右侧的数据赋值给左边的变量,例如:a 10; 3.变量名的命名规则: 变量名由数字…

【论文阅读】(2018)The Meet-in-the-Middle Principle for Cutting and Packing Problems

文章目录一、摘要二、介绍三、Normal Patterns 正常模式四、Meet-in-the-Middle Principle4.1 MIM Patterns4.2 MIM 的性质4.2.1 性质14.2.2 性质24.2.3 性质34.2.4 性质4五、Evaluation六、Conclusions论文来源:(2018)The Meet-in-the-Middl…

Odoo 16 企业版手册 - 采购之三向匹配采购收货和账单

三向匹配采购收货和账单的方式 Odoo 16采购模块中的3向方式匹配采购收货和账单功能将帮助您确保您仅为交付到您地址的产品支付供应商账单。在收到采购订单中订购的产品之前,您可能会收到供应商的供应商账单。但是,您可能希望推迟付款,直到产品…

tkinter: 基本+Button+Layout

简介 简介 Tcl 动态解释型编程语言可独立执行,多嵌入C程序中作为脚本引擎,或者作为使用Tk工具包的接口Tcl库可以创建一个或多个Tcl解释器实例,然后在这些实例上运行C或Tcl命令和脚本每个解释器有一个事件队列,接受事件并处理他们…

未来5年,Python发展前景如何?什么方向最吃香?

有同学提问——请问就未来3到5年来讲,python的发展趋势如何?我要不要深学下去?如果学建议从事python的哪个方向? 今天我们就来看一下一线技术人员的分析与解答。 因为一直在开发一线工作,经历了好些环节,…

PyTorch可视化工具Visdom教程

文章目录什么是visdom安装和启动安装启动可视化折线图Line什么是visdom visdom是Facebook为PyTorch开发可视化工具,支持numpy和tensor,功能和Tensorboard差不多,在三维空间数据展示十分出色,其次可以远程访问,随时随地观察训练效…

Linux 网络流量监控工具

Linux 网络流量监控 Linux 网络流量监控是捕获和分析企业的 Linux 网络流量的过程。 为什么要监控 Linux 网络流量 深入了解网络流量对于测量和管理带宽使用情况非常重要。分析 Linux 网络流量有助于识别带宽瓶颈、最高用量者和其他可能影响网络性能的网络问题。 Linux 网络…

Java+MySQL基于SSM的物流公司物流订单管理系统 毕业设计

随着我国经济的高速增长,物流快递的数量也在不断的增加,同时面临的就是如何更加方便快捷和高效的管理物流订单的问题,传统模式的物流订单管理模式明显已经不能够满足当下的需求,于是我们提出了基于B/S的贴心物流公司物流订单管理系统的设计与开发。 用户登录界面 本课题是一个…

vue框架甘特图控件(dhtmlxGantt)

官网JavaScript UI Framework - HTML5 Controls Library - DHTMLXJavaScript UI framework for high-speed web and mobile app development with customizable HTML5 UI controls. Free trial version available.https://dhtmlx.comGit及实例 GitHub - DHTMLX/gantt: GPL ver…

LC-1751. 最多可以参加的会议数目 II(动态规划)

1751. 最多可以参加的会议数目 II 难度困难69 给你一个 events 数组,其中 events[i] [startDayi, endDayi, valuei] ,表示第 i 个会议在 startDayi 天开始,第 endDayi 天结束,如果你参加这个会议,你能得到价值 valu…

用 Pandas 处理结构不佳的 Excel 文件

简介 用pandas很容易读取Excel文件并将数据转换为DataFrame。然而现实世界中的Excel文件往往构造不佳,在那些数据散落在工作表中的情况下,你可能需要定制读取数据的方式。本文将讨论如何使用pandas和openpyxl来读取这些类型的Excel文件,并干…

手机视频怎么裁剪时长?教你三招快速搞定

大家知道手机视频怎么裁剪时长吗?现如今,新媒体行业发达,因为很多地方都需要用到视频文件,所以对视频处理的相关操作是免不了的。那么当你因为视频时长过长,导致视频无法发布的时候,你是怎么做的呢&#xf…

第六章JDBC基础详解

文章目录什么是JDBC数据库编程的必要条件JDBC工作原理JDBC如何建立数据库连接JBDC的基本操作添加操作修改操作删除操作查询操作JDBC使用的步骤JDBC的批处理操作JDBC数据源连接池关于执行sql语句的对象什么是JDBC 数据库编程的必要条件 编程语言,如Java&#xff0c…

靶向药物丨艾美捷西妥昔单抗Cetuximab方案

西妥昔单抗Cetuximab基本信息: 中文名 西妥昔单抗 英文名 Cetuximab 别名 西妥昔单抗 EGFR抑制剂 西妥昔单抗对照品 6-二氨基庚二酸 英文别名 IMC 225 Hsdb 7454 CETUXIMAB EGFR antibody CetuxiMab(C225) Cetuximab - Buffer solution CAS 205923-56-…

【图像增强】暗通道图像去雾【含GUI Matlab源码 740期】

⛄一、简介 1 暗通道先验图像去雾方法 1.1 光线透射率模型 光在传播中由于散射使得从光源发出的辐射只有部分能到达接收传感器,其他则被散射到传播介质中。假设距离较小时散射光强与距离是线性关系,当光源距离传感器无限接近时,光的衰减值可…