问题整理
- 使用influence_data数据集或其部分创建音乐影响力的(多个)定向网络,其中影响者与关注者相连。开发捕捉此网络中“音乐影响的参数”。通过创建定向影响网络的子网络来探索音乐影响力的子集。描述这个子网络。你的“音乐影响”指标在这个子网络中揭示了什么?
- 使用full_music_data和/或两个音乐特征的汇总数据集(与艺术家和年份),以制定音乐相似性度量。 用你的衡量标准,流派中的艺术家是否比流派之间的艺术家更相似?
- 比较流派之间和流派内部的相似之处和影响。流派有什么区别?流派如何随着时间的推移而变化?有些流派与其他类型有关吗?
- 请说明data_influence数据集中报告的相似性数据是否表明被识别的影响者实际上影响了各自的艺术家。这些 "影响者 "是否真的影响了追随者所创作的音乐?是某些音乐特征比其他特征更有 “传染性”,还是它们在影响某位艺术家的音乐方面都有类似的作用?
- 从这些数据中**找出是否有可能标志着音乐演变中的革命(重大飞跃)的特征?**在你的网络中,哪些艺术家代表了革命者(重大变革的影响者)?
- 分析一个流派随着时间的推移而发生的音乐演变的影响过程。你的团队能否找出揭示动态影响因素的指标,并解释该流派或艺术家是如何随着时间的推移而变化的?
- 你的作品如何表达音乐在时间或环境中的文化影响?另外,如何在网络内识别社会、政治或技术变革(如互联网)的影响?
思路整理
怎样客观地分析音乐(2124497)
构建影响力网络
- 活跃在某一年代的艺术家被活跃在其他年代的艺术家追随有关的指标;
- 某一流派的艺术家被其他流派的艺术家追随有关的指标;
- 影响者的外度。
我们构建了一个加权有向图 G ( V , E ) G(V,E) G(V,E)来代表影响力网络,其中一条边是由影响者指向追随者的。
因此,计算出的两位艺术家之间的影响力是一条有向边的权重。
量化相似性
由于提供的数据集full_music_data包含高维数据,因此需要降维。
我们使用修改后的随机分布嵌入(RDE)框架,以很好地利用高维数据的交互信息。
原始框架:
MRDE框架:
流派内与流派间相似度
贝叶斯误差率被用来识别流派内和流派间的分布是否有明显的差异。
相似度与影响力的关系
分析音乐特征
我们通过检查Kruskal-Wallis检验的P值来分析音乐特征的两种作用。我们将每个特征逐一删除,并比较删除某些特征前后的p值。
检测革命艺术家
我们通过使用修改后的接近度中心性(in-closeness和out-closeness中心性的综合)检测influence网络中的重要节点,检测出最具革命性的艺术家。
我们所说的革命性的艺术家,一般是指他们对该领域的贡献应该是巨大的。此外,他们应该对其他人产生巨大的影响,同时从其他人那里得到小的影响。
我们结合内聚性和外聚性来评估一个艺术家在革命者中的重要性。我们的目标是发现那些具有较小的内部中心性和较大的外部中心性的艺术家。
分析动态进化过程
通过连接离散傅里叶变换(DFT)和检测由低频成分重建的时间序列,我们可以观察到音乐特征中的低频成分随时间的变化。我们提出了一个指标σ来衡量低频成分在所有频率成分中的比例。
测试模型
上边给出了国家内部的相似度分布,而高斯定律的结果是N(0.85,0.06)。与之前定义的相似度分布不同(其中相似度表示某一流派中每两个节点之间的相似度),我们重新定义了中心节点与国家内部其他节点之间的相似度值分布。
新分布的高斯定律结果是N(0.45,0.04)。与原始分布(即N(0.85,0.06))相比,相似性的期望值明显减少,这意味着我们提出的中心节点模型是有效的。
音乐家动态网络中的影响和相似性度量(2101855)
重新缩放的PageRank以度量影响
- 首先提取静态图结构网络,并且比较有向图与无向图间边的数量以及平均测地距离的差异。边缘数量之间的差异相当小,这表明音乐家之间的双向影响相当少。同时,有向图的平均距离远小于无向图表明,伟大的明星经常影响他人,而他们不容易受到他的年轻一代的影响,当代也很少相互影响。
- 引入初始的PageRank模型。
- 提出原始PageRank模型中存在的三个问题。(1)它忽略了网络的时间结构,这可能会产生不现实的特征。(2).PageRank的重新分布在时间上强烈偏向于旧节点,这使得新节点的PageRank得分接近0。(3)PageRank算法没有考虑一个追随者受不同影响者的影响程度不同。
- 为了解决问题(2),作者引入的相对位置,以此来减少对于旧结点的偏好。
- 利用当前版本的PageRank模型进行一次影响力计算,并可视化前100位艺术家的流派与年份。
- 进行相似度度量。
- 通过艺术家之间的相似度量化影响,解决问题(3)。
- 考虑影响者的滞后效应,解决问题(1)。
- 利用最新的PageRank再次进行计算,可视化。
量化相似度
流派内与流派间的相似度
相似度与影响力的关系
对比两次PageRank模型计算结果:
流派内
第一次中,影响由“数量可以观察到,即使在重新调整的指标下,老音乐家的影响力也会更大。这是自然的——更有经验的艺术家应该获得更高的地位。
在考虑了相似性之后,它更关注的是现在的流行情况。虽然很难从几十年前的作品中学习,但现在的时尚将更常被模仿。所以相似性实际上是衡量影响程度第二次计算所示。在更新的模型中,强调了更多在他/她的时代定义风格的音乐家,因此年轻的音乐家更多地出现在前100名中。这表明我们的措施包含了两方面的影响。
流派间
流派之间的影响可以从不同流派的重要性中体现出来。比较两次结果所示的流派,在更新的模型中可以观察到流行/摇滚和黑人音乐的份额略有增加。这两种模式都未能捕捉到这些音乐流派。所以,虽然我们可以通过相似性来区分流派,但这并不能决定流派之间的差异。
这表明体裁主流化的程度决定了其影响力。而相似性的影响并不常见。它可能在创作中发挥着重要作用,尽管如此,听众可能更喜欢更主流、更接近主流音乐的音乐。
影响者真的影响了追随者吗?
分析动态进化过程
规模和影响力
选取几个流派进行所占比例以及影响力变化的可视化图像绘制。
分析变化趋势。
流派之间关系的度量
通过不同时期的不同权重向量,我们能够计算一个特定流派的平均余弦距离,以通过其平均音乐特征来表示该流派是否与其他流派更相似或在流派之间更常见。
革命的识别
内部外部两个层面的语文建模,注意与现实结合。
分析内部时对一些音乐特征进行了可视化处理。
灵敏度分析
改变计算相对位置时窗口的大小,很大时均值会趋近于0,很小时会失去相对位置的意义,故取中间值最合适,验证了自己的取值。
来自GCN的证据:我们能从网络结构中找到更多信息吗?
通过图卷积神经网络进行20个流派的聚类,发现网络本身很难挖掘更多的信息,验证了正文中仅考虑六个流派的正确性。
进一步讨论
音乐影响如何导致音乐革命?(2107091)
建立影响力网络
首先,我们将每个音乐家作为一个节点,并通过考虑时间跨度和流派跨度的因素来计算音乐家之间的有向影响作为权重,以构建一个有向音乐影响网络。然后我们使用社会网络分析(SNA)来分析影响网络。
- 将合唱音乐定义为无效音乐并删除。
- 对音乐家之间的影响进行分类(1)从流派跨度来看:影响发生在同一流派内部和不同流派之间。(2)从时间跨度上:晚辈影响前辈,前辈影响晚辈。
- 分别定义时间跨度影响因子和流派跨度影响因子。
- 定义图的边权值。
- 使用社会网络分析(SNA)方法分析定向网络。通过计算每个音乐人在音乐影响力有向网络中的度中心度,进而计算用PageRank思想修正的特征向量中心度,来度量和分析每个音乐人的影响力。
(1)计算度中心性
在无向网络中,可以使用节点的度来测量该点的中心度。类似地,在我们构建的音乐影响导向网络中,我们可以使用节点的度外权重之和来衡量微观层面上节点影响的重要性。这一指标背后的假设是,具有许多联系的节点是重要节点,这意味着对更多人产生影响的音乐家具有更强的影响力。因此,我们给出了点i的度中心性(DCi)的定义:
(2)计算特征向量中心性
节点的重要性取决于其相邻节点的数量及其相邻节点的重要性。这意味着连接到节点i的节点越重要,节点i就越重要。我们定义了特征向量中心性ECi,以测量节点i在宏观层面上的重要性。
其中lambda是缩放常数,迭代的初始值设置为:
然而,对于我们构建的有向网络,上述分析过程只考虑了相邻节点的重要性。为了增加节点本身对外部的影响,我们基于PageRank思想修改了公式。
7. 我们定义音乐家i的音乐影响力为:
8. 计算每个音乐家的影响力,以表格的形式体现部分艺术家的影响力,与一些权威性榜单上的排名进行比较进行模型的验证。
9. 验证音乐影响力网络是一个无标度网络,音乐影响力网络服从帕累托法则。只有一小部分音乐人影响很多其他音乐人,而大部分音乐人不影响其他音乐人。这也意味着少数极具影响力的音乐人将对乐坛产生影响。
10. 进行音乐影响自网络分析。
分别从influence_data中选择跨流派影响数据、流派内影响数据、前辈影响数据和后辈影响数据,以建立音乐影响子网络。然后分别计算音乐影响并归一化。每种影响类型和音乐影响子网络的计算结果如图所示 :
每个子网络中节点的大小表示相应类型歌手的MI,而有向曲线的厚度表示影响的权重。从图中可以看出(4),体裁内的影响出现频率高于体裁间的影响,前人对后继者的影响出现频率高于后者对前人的影响出现频率。可以得出结论,在音乐人的互动中,音乐人更容易影响同一流派的音乐人,音乐人更容易影响后辈而不是前辈。