基于Python数据可视化的网易云音乐歌单分析系统

news2024/12/23 13:26:26

目录

《Python数据分析初探》项目报告

    • 基于Python数据可视化的网易云音乐歌单分析系统
    • 一、项目简介
      • (一)项目背景
      • (二)项目过程
    • 二、项目设计流程图
      • (一)基于Python数据可视化的网易云音乐歌单分析系统的整体架构
      • (二)获取歌单索引页的信息
      • (三)获取歌单详情页的信息
      • (四)歌曲出现次数 TOP10
      • (五)网易云音乐欧美歌单播放 TOP10
      • (六)网易云音乐欧美歌单评论 TOP10
      • (七)欧美歌单播放数量分布情况
      • (八)网易云音乐欧美歌单标签图
      • (九)歌单介绍词云图
    • 三、项目实现代码 (太长,略)
    • 四、项目分析结果
      • (一)歌曲出现次数 TOP10
      • (二)网易云音乐欧美歌单播放 TOP10
      • (三)网易云音乐欧美歌单评论 TOP10
      • (四)欧美歌单播放数量分布情况
      • (五)网易云音乐欧美歌单标签图
      • (六)歌单介绍词云图
      • (七)音乐歌单运营分析
      • (八)歌单数据可视化的商业价值

基于Python数据可视化的网易云音乐歌单分析系统

有任何学习问题可以加我微信交流哦!bmt1014
一、项目简介
(一)项目背景 1
(二)项目过程 1
二、项目设计流程图 3
(一)基于Python数据可视化的网易云音乐歌单分析系统的整体架构 3
(二)获取歌单索引页的信息 4
(三)获取歌单详情页的信息 5
(四)歌曲出现次数 TOP10 6
(五)网易云音乐欧美歌单播放 TOP10 6
(六)网易云音乐欧美歌单评论 TOP10 7
(七)欧美歌单播放数量分布情况 7
(八)网易云音乐欧美歌单标签图 8
(九)歌单介绍词云图 8
三、项目实现代码 (代码太长,没放)
(一)netease_cloud_music_data_analysis.py 9
(二)music_index.py 11
(三)music_detail.py 13
(四)top_10_song.py 15
(五)top_10_ea_song_playlists.py 17
(六)top_10_of_ea_song_collection.py 19
(七)top_10_of_ea_song_comment.py 21
(八)top_10_ea_song_collection_distribution.py 23
(九)top_10_ea_song_playlists_distribution.py 25
(十)label_ea_song.py 26
(十一)music_wordcloud.py 28
四、项目分析结果 30
(一)歌曲出现次数 TOP10 31
(二)网易云音乐欧美歌单播放 TOP10 32
(三)网易云音乐欧美歌单评论 TOP10 32
(四)欧美歌单播放数量分布情况 33
(五)网易云音乐欧美歌单标签图 34
(六)歌单介绍词云图 35
(七)音乐歌单运营分析 35
(八)歌单数据可视化的商业价值 37

一、项目简介

(一)项目背景

随着音乐软件的普及,海量的相关数据被创造。在大数据的时代,任何大量的数据一旦被利用起来,将会产生巨大的价值。利用 Python 分析歌曲的相关数据来挖掘客户的需求并更进一步的扩大用户量的例子比比皆是。
考虑到现实的可操作性以及 Python 在数据分析和交互、探索性计算以及数据可视化等方面都有非常成熟的库。且经过小组测试可行性,决定利用 Python 对音乐软件歌单进行分析。

(二)项目过程

此次项目利用 Python 对网易云音乐歌单数据的获取,对歌单数据进行可视化分析。得出歌单的评论、收藏、播放、贡献、分布的数量图以及词云,并提出歌单优化的建议。
项目利用爬虫对数据获取,后对其进行数据清洗,最终进行数据可视化。在分析过程中使用 numpy, pandas, matplotlib, time, requests, squarify, jieba, wordcloud, bs4 第三方模块,最后以柱状图,词云图 以及标签图来展示歌曲收藏量,播放量等相关分析结果并结合相关数据优化歌单播放量。
最后我们实现了项目,并对项目进行了测试。
图 1 歌单索引网页调试分析

图 2 歌单详情网页调试分析

二、项目设计流程图

(一)基于Python数据可视化的网易云音乐歌单分析系统的整体架构

图 3 基于 Python 数据可视化的网易云音乐歌单分析系统的整体架构图

(二)获取歌单索引页的信息

图 4 获取歌单索引页的信息的流程图

(三)获取歌单详情页的信息

在这里插入图片描述

(四)歌曲出现次数 TOP10

在这里插入图片描述

(五)网易云音乐欧美歌单播放 TOP10

在这里插入图片描述

(六)网易云音乐欧美歌单评论 TOP10

在这里插入图片描述

图 8 网易云音乐欧美歌单评论 TOP10 的流程图

(七)欧美歌单播放数量分布情况

在这里插入图片描述

图 9 欧美歌单播放数量分布情况的流程图

(八)网易云音乐欧美歌单标签图

在这里插入图片描述

图 10 网易云音乐欧美歌单标签图的流程图

(九)歌单介绍词云图

在这里插入图片描述

图 11 歌单介绍词云图的流程图

三、项目实现代码 (太长,略)

四、项目分析结果

网易云用户是很习惯创建歌单的一个用户群体,很多用户也是通过歌单了解到一些歌曲。一个网易云用户甚至自己一个人就创建上百个歌单,我们爬取了网易云欧美歌单的数据,制作了以下表格。

(一)歌曲出现次数 TOP10

在这里插入图片描述

图 12 网易云音乐欧美歌单歌曲 TOP10
我们获得了网易云音乐欧美歌单中的 TOP10 歌曲,相信熟悉欧美歌曲的小伙伴们对这些歌都很熟悉,他们曾经或许就出现在推荐给你的歌单中。

(二)网易云音乐欧美歌单播放 TOP10

在这里插入图片描述

图 13 网易云音乐欧美歌单播放 TOP10
这是欧美歌单播放量前十排行榜,第一名拥有高达 4 亿的播放量,可见欧美歌曲是非常令人欢迎的。在歌单中统计中我们可以看到旋律和节奏是很多欧美音乐爱好者们比较看重和喜欢的。

(三)网易云音乐欧美歌单评论 TOP10

在这里插入图片描述

图 14 网易云音乐欧美歌单评论 TOP10
可以看到歌单【定制 最懂你的欧美推荐 每日更新35首】的评论数量最多。这可能与他日更与定制的性质有关。可以看到,很多热门的歌单其评论通常也很多。这个榜单中的歌单在上一个热门歌单的榜单也能找到。

(四)欧美歌单播放数量分布情况

在这里插入图片描述

图 15 欧美歌单播放数量分布情况
将播放数做对数处理,使得能直观看出歌单播放数的分布。
歌单播放数主要分布在 0-1000 万。
其中 ln(10000000) = 16。

(五)网易云音乐欧美歌单标签图

在这里插入图片描述

图 16 网易云音乐欧美歌单标签图
我们还找到了这些歌单的标签情况,既然是欧美歌单,【欧美】自然就占大头,几乎一半。我们还可以看到【电子】和【流行】这两大类也是非常多,【欧美流行】和【欧美电子】近两年在网易云用户中越来越火爆,特别是【欧美电子】,不少青年已经是电子音乐的忠实粉丝。

(六)歌单介绍词云图

在这里插入图片描述

图 17 歌单介绍词云图
歌单介绍词云图,这些词包括一个歌单的风格,背景还有故事。或许你曾经是因为哪一个词打动了你,让你收藏的这份歌单。与歌曲产生共鸣。

(七)音乐歌单运营分析

歌单有两种形式,一种是由官方创建的歌单,另一种是由用户自主创建的歌单,在网易云中,我们收藏倾听的大多来自个人用户。而歌单的运营不论是对个人还是官方都是有意义的。
很多用户是以歌单作为入口来了解音乐的,很少主动的的持续的去搜索音乐,所以歌单是否丰富,歌单的品质是否足够好,决定了用户使用的频率和时间。用户能够获取到越多越好的好歌单,就意味着这个音乐平台更有价值。
对于个人而言,创造令很多人满意的歌单,让个人获得关注,更高的成就感,进而创造更好的精品歌单。
所以我们基于以上的分析,做出了一个关于欧美歌单的运营分析:
在歌单内容方面,图15 网易云音乐欧美歌单标签图里,我们可以看出,流行类标签和电子标签占比大约 50%。以标签分类实行个性化推荐,可以让歌单更容易被找到,曝光,便于管理。
另外我们的歌单可以向这两个热门的方向靠拢,面向受众面广的人群,可以获得可观的流量。再加上电子音乐的兴起,越来越优秀的电子音乐出现,可以丰富我们的歌单。
在歌单标题方面,歌单相当于一篇文章,歌单的标题可以吸引听众的注意力,让他们进来了解歌单,收听歌单。在歌单播放量 TOP10 和歌单评论数量 TOP10 中,我们区分出以下几类:
在特殊标志式方面,在前十的几个歌单名称中我们可以看到“【】“,”|“等特殊字符,这些特殊字符可以吸引听众的目光,强调自己歌单的亮点。
在强吸引式方面,使用“精选“,”10w+“,”专属“等字眼,驱使听众点击。
在结论式方面使用,“热血燃向 | 提神醒脑防嗜睡型 BGM” 等字眼,驱使听众点击。
综上所述,一份歌单成功离不开标题、歌曲风格、乃至歌曲数。只有平衡好其中的因素,才能使其播放量达到预期。

(八)歌单数据可视化的商业价值

歌单数据可视化可以帮助音乐公司更好地理解消费者喜好,并为消费者提供更符合他们喜好的歌单。
此外,歌单数据可视化还可以帮助音乐公司更好地分析歌单中的信息,并利用这些信息来决定如何定价、营销和分销音乐。
因此,歌单数据可视化具有一定的商业价值,可以为音乐公司提供重要的市场信息。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1317645.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

栈(C语言版)

一.栈的概念及结构 栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。 进行数据插入和删除操作的一端 称为栈顶,另一端称为栈底。 栈中的数据元素遵守 后进先出 LIFO ( Last In First Out )的原则。…

【图像分类】【深度学习】【Pytorch版本】 ResNeXt模型算法详解

【图像分类】【深度学习】【Pytorch版本】 ResNeXt模型算法详解 文章目录 【图像分类】【深度学习】【Pytorch版本】 ResNeXt模型算法详解前言ResNeXt讲解分组卷积(Group Converlution)分割-变换-合并策略(split-transform-merge)ResNeXt模型结构 ResNeXt Pytorch代码完整代码总…

Vue3页面如何设置rem单位的依据“根font-size”的两种方式

最近在对项目做整体的自适应。我们可以通过设置meta的viewport属性设置屏幕的缩放,但有时候,屏幕缩放了但字体大小也需要做相应的调整才能达到更好的自适应效果。我们很容易想到使用媒体查询rem来实现字体的自适应。 rem单位:“rem” 是 “ro…

XXE实体注入漏洞知识点

什么是XXE漏洞? XXE,即XML外部实体注入漏洞,XXE 漏洞发生在应用程序解析 XML 输入时, 没有禁止外部实体的加载 ,导致可加载恶意外部文件,造成文件读取、命令执行、攻击内网网站等危险。 XXE漏洞触发的点…

甜酷女孩穿搭 I 时尚与保暖都兼具的羽绒服

这款工装风羽绒服 酷酷的中性风 清新温柔的杏紫两色 采用定制复合面料 顺滑平整硬朗的材质 具有防水功能 下雪下雨天也不用担心哦 90白鹅绒,立领连帽设计 帽子做的是可拆卸 可以切换两种风格 袖口采用可调节魔术贴设计 下摆可调节抽绳设计 处处透着细节…

Content-Type是什么

目录 Content-Type是什么 获取方式 设置方式 常见类型 application/x-www-form-urlencoded multipart/form-data application/json text/xml text/html text/plain Content-Type是什么 Content-Type出现在请求标头和响应标头中,意思是内容类型&#xff0…

用PHP和HTML做登录注册操作数据库Mysql

用PHP和HTML做登录注册操作数据库Mysql 两个HTML页面&#xff0c;两个PHP,两个css,两张图片&#xff0c;源码资源在上方。 目录 HTML页面 login.html <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta nam…

THEMIS---Beta Sprint Summary Essay Blog

Which course does this assignment belong to2301-MUSE社区-CSDN社区云What are the requirements for this assignmentbeta SprintThe goal of this assignmentTo summarize the beta task progress and the teams sprintsTeam NameThemisTop-of-the-line collection of essa…

Impala4.x源码阅读笔记(一)——HdfsTextScanner解析

前言 本文为笔者个人阅读Apache Impala源码时的笔记&#xff0c;仅代表我个人对代码的理解&#xff0c;个人水平有限&#xff0c;文章可能存在理解错误、遗漏或者过时之处。如果有任何错误或者有更好的见解&#xff0c;欢迎指正。 在文章Impala3.4源码阅读笔记&#xff08;七…

带你亲证AI应用开发的“奇点”时刻

带你亲证AI应用开发的“奇点”时刻 AI 应用开发——新的历史节点 事实上&#xff0c;没有任何一种突破能够不经历重重失败&#xff0c;不体验一轮轮的痛苦&#xff0c;就能直接展现在人类面前。AI 技术自诞生之初直至今日&#xff0c;其发展之路从未一帆风顺——辉煌与寒冬交…

Windows环境下QT应用程序的发布

时间记录&#xff1a;2023/12/17 1.生成版本介绍&#xff0c;debug&#xff1a;调试版本&#xff0c;携带调试信息&#xff0c;占用内存稍大一些&#xff0c;release&#xff1a;发布版本&#xff0c;一般开发完毕选择此套件进行编译生成可执行程序进行发布 2.发布步骤 &#x…

流程引擎相关资料

最近调研流程引擎相关知识&#xff0c;BPMN规范和流程引擎相关知识无法避开&#xff0c;以及市面上比较多的流程引擎产品。 BPMN2.0 基本形状 流对象&#xff08;Flow Objects&#xff09;&#xff0c;流对象是定义业务流程的主要图形元素。它进一步细分为三个类别&#xff0…

使用邮件群发平台,轻松实现高效沟通的4大优势!

新媒体带动着众多线上平台的发展&#xff0c;使得流量为企业带来了可观的营收。但是&#xff0c;随着短视频市场的饱和&#xff0c;想要再次获得初始时的流量就变得越发困难。在这个时候&#xff0c;企业不妨将眼光往邮件群发这个传统的营销方式上倾斜&#xff0c;特别是出海、…

LangChain 27 BabyAGI编写旧金山的天气预报

LangChain系列文章 LangChain 实现给动物取名字&#xff0c;LangChain 2模块化prompt template并用streamlit生成网站 实现给动物取名字LangChain 3使用Agent访问Wikipedia和llm-math计算狗的平均年龄LangChain 4用向量数据库Faiss存储&#xff0c;读取YouTube的视频文本搜索I…

别小看Python的【print】函数,这些高级用法你知道吗?

文章目录 引言技巧1&#xff1a;格式化输出示例1&#xff1a;使用%s来插入字符串&#xff0c;使用%d来插入整数示例2&#xff1a;使用字符串的format()方法示例3&#xff1a;使用f-string格式化输出 技巧2&#xff1a;控制输出文本的颜色技巧3&#xff1a;将打印结果重定向至文…

什么是Maven?

什么是Maven 1、Maven是依赖管理、项目构建工具。 pom.xml springBoot项目的核心配置文件&#xff0c;pom项目对象模型、Dependency依赖管理模型。 Maven中的GAVP是指&#xff1a; 1、GroupId&#xff1a;当前工程组织id&#xff0c;例如&#xff1a;com.jd.tddl 2、ArtifactI…

Redis-对象

参考资料 极客时间Redis&#xff08;亚风&#xff09; Redis对象 String • 基本编码⽅式是RAW&#xff0c;基于简单动态字符串&#xff08;SDS&#xff09;实现&#xff0c;存储上限为512mb。 • 如果存储的SDS⻓度⼩于44字节&#xff0c;则会采⽤EMBSTR编码&#xff0c;此…

QT:Unable to create a debugging engine.

debug跑不了&#xff1a; 报错&#xff1a;Unable to create a debugging engine. 参考&#xff1a; https://blog.csdn.net/u010906468/article/details/104716198 先检查是否安装了DEBUG插件 工具-》》选项 查看插件&#xff0c;如果没有的话&#xff0c;需要重新安装qt时…

计算机操作系统-第十七天

目录 处理机调度 调度的基本概念 作业 高级调度&#xff08;作业调度&#xff09; 中级调度&#xff08;内存调度&#xff09; 低级调度&#xff08;进程调度/处理机调度&#xff09; 进程的挂起态与七状态模型 挂起和阻塞的区别 三层调度的联系和对比 本节思维导图…

SDN控制器-ONOS中的最终一致性存储

ONOS中的数据存储基本上都是以KV进行存储的。按照一致性强弱类型可以分为强一致性存储&#xff08;strong consistency&#xff09;与弱一致性存储&#xff08;eventually consistency&#xff09;。 比较典型的&#xff0c;如ONOS中对于设备接口的存储&#xff0c;使用的是强…