数据分析Billboard音乐榜单,万万没想到...

2022-03-20 00:58:53



目的

Billboard 是最重要、最著名的音乐排行榜之一,它为听众和制作人提供了大量信息。Billboard的音乐图表基于一年直接销售和 airplay 积分的累计总额来计算每件作品的排名。我特别想知道 Billboard 的排名与音乐人的 “制作” 是否存在直接关系,所以我做了一些简单的分析。我做了一个网络爬虫项目,从 2006-2016 的图表中探究更多的信息。


流程

我创建了八个不同的 Python spider,从 Billboard 中爬取不同类型的图表。我爬到了乡村、电子、说唱、摇滚和 R&B 等不同类型的音乐图表。我还收集有每年的顶尖热门艺术家信息,以及自Billboard成立以来排名最高的音乐人信息。我用 Python 的 seaborn 包来可视化我的结果。


结果

我计算了每个音乐人在 2006-2016 时期排名的作品的总数量,从每张图表中选出了前 20 名的音乐人,以便将更多的细节可视化。

 

所有音乐 (2006-2016)


Rihanna 在这十年中具有领先优势。从图中我们可以看出,在这个时期她共有 30 首歌曲进入 Billboard 榜单前 100 首歌。




第二张图表显示了有关音乐人在特定年份中排名的歌曲数量的信息,以便我们能够了解他们每年的作品。



这个词云显示了所有排名较高的歌曲中最受欢迎的单词,这反映了在这十年中比较受欢迎的主题。




性别图表反映了性别是否是出现在前100名图表中的一个因素。看起来,在男性和女性艺术家旗鼓相当。最右侧的Group代表组合或乐队。



音乐人(2006-2016)


这张图表显示了十年来这些音乐人每年的流行程度。我们可以看到 Rihanna 和 Kenny Chesney 每年都在榜单上。




这张图显示十年来排名前20的流行艺人排名非常稳定。




音乐人(所有年份)


我将 2006-2016 年间的顶尖艺术家与所有年份排名靠前的艺术家进行交叉检查。下图中我们可以看到这些艺术家在 06-16 年间进入榜单的次数,排名列显示了艺术家在 06-16 年间在表中的排名。




饶舌音乐 (2006-2016)




R&B 和嘻哈音乐 (2007-2016)




摇滚乐 (2008-2016)




乡村音乐 (2006-2016)




电子音乐 (2013-2016)




所有独立音乐




所有单曲




统计分析(简单线性回归分析)

回归分析结果表明音乐人的制作与 Billboard 图表排名没有直接的线性关系。



结论

1.    有些音乐人在整个十年中都占据着主导地位,而另一些则只是灵光乍现。


2.   在某些特定的音乐流派中,存在着性别不平衡。


3.   数量并不等于质量; 发行更多的歌曲和专辑并不一定会提高进入榜单的概率。


GitHub项目链接: https://github.com/nash13cxw/BillboardAnalysis.

 




译者介绍

苏安东


北京化工大学信息科学与技术学院在读研究生。希望大数据技术惠及每个人,让我们的生活更加美好!





友情链接