Original size 1140x1600

Spotify: итоги 2024 года

5

Концепция

Spotify — наиболее известный по всему миру музыкальный стриминговый сервис, позволяющий прослушивать музыкальные композиции, аудиокниги и подкасты. К сожалению, в последний год многие из нас потеряли к нему доступ и перешли на Яндекс музыку, однако это совсем не повод для того, чтобы не интересоваться вкусами зарубежных слушателей. В поисках датасета для своего проекта в Kaggle автор заметил весьма любопытную таблицу под названием Most Streamed Spotify Songs 2024 с итогами Spotify за 2024 года, и ему стало интересно её изучить.

Оформление

Найти решение с цветовой палитрой было несложно — для этого я обратилась к поисковику Google с запросом показать мне цветовую палитру платформы, которой посвящён проект, на что он любезно ответил мне рядом изображений с одной и той же палитрой из четырёх оттенков:

big
Original size 1024x225

Далее оставался нерешённым вопрос со шрифтовым оформлением, с которым у автора проекта, к сожалению, вышли неполадки. Изначально планировалось подобрать шрифт динамичный шрифт Autonomous (изображён на цветовой схеме), однако после долгой борьбы с кодом за возможность встроить шрифт в диаграммы автор сдался и решил спросить у библиотеки matplotlib, какими шрифтами она располагает. Из вышедшего списка автор решил выбрать шрифт Liberty Sans, потому что другие предложенные шрифты были далеки от эстетики проекта.

from matplotlib import font_manager

Список доступных шрифтов

available_fonts = [f.name for f in font_manager.fontManager.ttflist] print (available_fonts) ['STIXGeneral', 'DejaVu Serif Display', 'DejaVu Sans', 'STIXNonUnicode', 'DejaVu Sans', 'DejaVu Sans Mono', 'STIXSizeThreeSym', 'cmr10', 'DejaVu Serif', 'STIXNonUnicode', 'cmex10', 'DejaVu Sans Mono', 'STIXSizeTwoSym', 'STIXSizeFiveSym', 'STIXGeneral', 'cmss10', 'cmtt10', 'STIXSizeFourSym', 'DejaVu Sans Mono', 'cmb10', 'DejaVu Serif', 'STIXSizeOneSym', 'STIXSizeTwoSym', 'STIXSizeThreeSym', 'cmmi10', 'DejaVu Sans Mono', 'DejaVu Serif', 'DejaVu Serif', 'DejaVu Sans', 'DejaVu Sans Display', 'DejaVu Sans', 'STIXSizeFourSym', 'STIXSizeOneSym', 'STIXNonUnicode', 'STIXGeneral', 'STIXGeneral', 'STIXNonUnicode', 'cmsy10', 'Liberation Sans Narrow', 'Liberation Mono', 'Liberation Serif', 'Liberation Serif', 'Liberation Sans', 'Liberation Sans', 'Liberation Mono', 'Liberation Serif', 'Liberation Sans Narrow', 'Liberation Serif', 'Liberation Sans', 'Liberation Sans Narrow', 'Liberation Mono', 'Liberation Sans Narrow', 'Liberation Sans', 'Liberation Mono', 'Humor Sans']

Аналитическая часть

Для аналитической части автор использовал 4 вида диаграмм: Гистограмма Круговая диаграмма Линейная диаграмма Горизонтальная столбчатая диаграмма

Original size 1189x590
Original size 1434x418

Для создания представленной гистограммы я соотнесла колонки Artist и Spotify Streaming и отобрала только первые 10 строк. В итоге у меня получился ТОП 10 самых популярных артистов по количеству прослушиваний в Spotify. Собственно, как и в прошлом году, им стал The Weeknd

Original size 1478x768
0

Затем автор решил поинтересоваться, какая буква стала самой популярной среди предложенных названий популярных треков 2024 года. Для этого понадобилась помощь Chat GPT версии 4.0, чтобы понять, каким образом отчленить по первой букве от названия каждого трека из колонки Track и расположить все результаты иерархически. Chat GPT подсказал, что это можно сделать с помощью меток [item[0]] и [item[1]], а также списка top_4, ведь мой топ-лист состоит всего из 4 самых популярных букв. Таким образом оказалось, что самой популярной буквой стала S

Original size 1189x590
0

Автору эта диаграмма нравится больше всего! Перед её созданием автор обнаружил в таблице данные по стримингу трека на платформе YouTube, после чего ему захотелось узнать, насколько количество прослушиваний треков артиста в Spotify отлично от количества прослушиваний его треков на YouTube. Для создания линейной диаграммы автор задействовал данные из трёх колонок таблицы: Artist, Spotify Streams и YouTube Views. Чтобы на диаграмме отображалась конкретно разница, была использована функция df['Difference'], где значения колонки Youtube Views вычитались из значений колонки Spotify Streams. По итогам оказалась, что наибольшая разница между количеством прослушиваний на Spotify и количеством прослушиваний на YouTube в 2024 была обнаружена у The Weeknd-а. Победитель уже во второй категории!

Original size 990x590
0

Затем автор поинтересовался, в какой месяц было впущено наибольшее количество треков в 2024 году. Для этого он обратился к колонке Release Date, где сфокусировался конкретно на месяце выпуска и разделил из на сезоны с помощью функции def get_season (date), где код идентифицирует месяц по соответствующим цифрам месяца. (например: if date.month in [12, 1, 2]: return 'Winter') Получившаяся столбчатая диаграмма показала, что самым продуктивным временем для музыкантов в 2024 году стала весна, но самым удивительным оказалось то, что осенью не было выпущено ни одного трека из таблицы! Возможно, в этот период на творцов напала осенняя хандра…

Итог

По итогам небольшого анализа было выявлено, что среди зарубежных исполнителей самым популярным оказался The Weeknd (как и в прошлом году), самой используемой буквой на первом месте в названии треков стала S, а самым плодотворным месяцем стала весна :) Перечисленные победители получат самые лучшие подарки от Санты. Кстати, а вот и он!

Original size 1472x832

prompt: «a 3D-rendered Santa Claus sitting comfortably in a cozy, festive environment. He is wearing his iconic red Christmas hat with white trim and pom-pom, paired with his classic red suit. Santa h

изображение было сгенерировано моделью LeonardoAI

Счастливого Нового Года!