Original size 1140x1600

Фактор Х — что определяет популярность песни на Spotify?

PROTECT STATUS: not protected
The project is taking part in the competition

Вводная часть

Музыка на Spotify сегодня — это огромная экосистема из сотен тысяч треков, где каждая песня превращена в набор чисел. За сухими значениями danceability, energy, valence и loudness скрываются настроения, телесные ощущения и эмоциональные сценарии, которые проживает слушатель.

Во время очередного прослушивания музыки, мне стало интересно: что действительно определяет популярность?

Исследование

Что исследуется?

Аудиохарактеристики 114,000 реальных треков из Spotify в контексте жанра и популярности, чтобы выявить, какой фактор действительно определяет успех песни на платформе.

Исследовательский вопрос:

Что влияет на популярность песни на платформе Spotify?

Данные:

Источник: Spotify Tracks Dataset (Kaggle) Размер: 114,000\+ треков Столбцов: 25 (имена артистов, названия, 9 аудиохарактеристик и др.) Жанров: 125 категорий Формат: CSV

Метод:

Очистка и подготовка данных (Pandas) Статистический анализ (корреляции Пирсона, тесты ANOVA) Профессиональная визуализация (Matplotlib, Seaborn)

Визуал

Выбор стиля

В основе визуальной концепции проекта лежит тёмная неоновая тема, навеянная эстетикой цифровой среды. Источниками вдохновения стали интерфейс Spotify, панельное освещение DJ-оборудования и атмосфера электронных концертов.

Изучение датасета

В основе проекта лежит крупный открытый датасет Spotify треков с Kaggle, включающий более 114 000 композиций и 125 жанров. Изначально рассматривались и более компактные наборы данных, однако для анализа закономерностей жанровой популярности они оказались слишком узкими по охвату и количеству треков. Поэтому был выбран именно этот датасет: в нем уже содержатся рассчитанные аудиохарактеристики Spotify, что снимает необходимость напрямую обращаться к Spotify Web API.

Перед началом анализа была изучена структура таблицы и её ключевые поля: названия треков, артисты, популярность, жанровые метки и девять основных аудиохарактеристик:

danceability — насколько трек подходит для танцев, с учётом ритма, стабильности бита и общей «пластичности» музыки.

energy — субъективная «энергичность» трека: громкость, насыщенность, динамика, степень «напряжения» звучания.

valence — «позитивность» трека, от мрачного и грустного (0) до светлого и радостного (1).

loudness — средняя громкость трека в децибелах, отражающая общую «мощь» звучания.

speechiness — доля разговорной речи в треке; высокие значения характерны для рэпа, подкастов, спокен-ворда.

acousticness — вероятность того, что трек акустический; чем выше значение, тем меньше электронных инструментов.

instrumentalness — вероятность того, что трек инструментальный (без вокала или с минимумом голосовых элементов).

liveness — степень «живого» исполнения: наличие шума зала, аплодисментов, особенностей live-записи.

tempo — темп трека в ударах в минуту (BPM), задающий скорость и ритмическое ощущение композиции.

Такой состав признаков позволяет рассматривать музыку как набор звучащих параметров и как объект пользовательского поведения.

Подготовка данных к анализу

До построения визуализаций понадобилась предварительная очистка и унификация данных. Были проверены типы столбцов, выявлены и удалены пропуски в ключевых аудиохарактеристик, а также отфильтрованы строки с некорректными значениями. Для дальнейшего анализа популярности внутри датасета была введена категоризация по уровню популярности треков (например, низкая, средняя и высокая), основанная на числовом поле popularity, что упростило сравнение аудиопрофилей разных групп песен.

Отдельное внимание уделялось жанровым данным: из полного множества категорий были выбраны наиболее часто встречающиеся жанры (топ-15), чтобы в визуализациях не терялась читаемость и можно было выявить устойчивые паттерны в популярности основных музыкальных направлений. После такой подготовки датасет стал удобной основой для статистического анализа и дальнейшей визуализации роли жанра в определении успеха трека.

Распределение аудиохарактеристик Spotify

Первым делом стоит ответить на базовый вопрос: «Что типично для треков в данной выборке?»

Original size 1539x400

Ось X показывает, насколько выражена в базе треков та или иная характеристика; Ось Y показывает, сколько треков имеют такое (или похожее) значение этой характеристики.

Удалось узнать, что:

1. Большинство треков умеренно или довольно танцевальные — около 0.6.

2. Энергия «среднего трека» также около 0.6, не экстремальная.

3. Темп Есть и медленные, и быстрые песни, но больше всего песен с темпом около 110–130 BPM. Именно такой темп можно встретить среди «попсовых» песен чаще всего.

Original size 1539x400

Ось X показывает, насколько выражена в базе треков та или иная характеристика; Ось Y показывает, сколько треков имеют такое (или похожее) значение этой характеристики.

4. Позитивность сильно варьируется: есть и грустные, и радостные песни.

5. Громкость Почти всё лежит в диапазоне примерно от -5 до -20 дБ, с центром ближе к -8…-10 дБ. Это значит, что песни достаточно громкие, но не упираются в максимум, то есть приведены к типичному уровень громкости стриминговых сервисов.

6. Живость Можно заметить, что преимущественно песни студийные. Значения, характерные для концертов, где много шума зала, встречаются редко.

Original size 1539x400

7. Акустичность Большинство треков — это продюсированная музыка. Треки, тяготеющие к акустичности, равномерно распределены между 0.2 и 1.0

8. Инструментальность Очень высокий столбик в районе нулевого значения, а это значит, что большинство треков с вокалом, чисто инструментальной музыки мало.

9. Речевой контент Высокая концентрация треков у 0 — в выборке нет треков с речью без стихов. Более низкие значения приходятся на музыку с репом.

Тепловая карта корреляций

Теперь, когда мы выяснили характер «среднего трека», можно понаблюдать за корреляцией аудиохарактеристик и попробовать проследить паттерны.

Original size 2830x2369

Розовый цвет — наибольшая корреляция, зеленый — наименьшая

Цифры на карте — это коэффициенты корреляции Пирсона, которые колеблются от -1 до +1:

+1 = полная положительная связь; 0 = никакой связи; -1 = полная отрицательная связь.

Приходим к следующим выводам: 1. Самая сильная отрицательная связь (-0.716) между энергией и акустичностью. Это значит, что если песня энергичная, она почти всегда электронная.

2. Вторая по силе связь: положительная (+0.621) между энергией и громкостью, что логично, ведь энергичные песни громче, а спокойные тише.

3. Третья по силе связь: положительная (+0.594) между танцевальностью и позитивностью — танцевальные песни обычно весёлые и позитивные.

4. Корреляция среднего уровня (-0.488) между громкостью и акустичностью, и это говорит о том, что акустические песни обычно тише электронных.

Стоит отметить отсутствие корреляций с речевым контентом. Это значит, что наличие речи в песне почти не влияет на другие параметры.

Из этого анализа проясняется существование двух противоположных «миров» музыки: электронной энергичной (высокие energy, danceability, loudness, низкая acousticness) и акустической спокойной (высокая acousticness, низкие energy и loudness).

Аудиохарактеристики по уровням популярности

Вопрос, на который отвечает следующий график: Как именно распределяются аудиохарактеристики у треков с разной популярностью (низкой, средней, высокой), и есть ли систематические сдвиги между этими группами?

0

Теперь, когда мы знаем, как в целом устроены аудиохарактеристики треков, можно посмотреть, как их распределения меняются в зависимости от уровня популярности. Скрипичная диаграмма позволяет сравнить форму распределения внутри трёх групп: треков с низкой, средней и высокой популярностью.

Приходим к следующим выводам: 1. У треков с низкой популярностью распределение энергии смещено вверх: они в среднем более энергичные, чем высоко популярные треки, у которых плотность сосредоточена ближе к средним и ниже среднего значениям. Это подтверждает, что чрезмерная энергичность не делает трек более популярным. 2. Формы распределений по танцевальности у разных уровней популярности очень похожи. Небольшие сдвиги не дают чёткой картины преимущества — это визуальное подтверждение того, что танцевальность сама по себе почти не влияет на популярность. 3. У популярных треков «скрипка» заметно смещена к более высоким значениям, а у непопулярных — к нижним. Это означает, что популярная музыка в среднем более акустическая, а слишком электронные треки чаще остаются нишевыми. 4. Распределения позитивности у трёх групп почти накладываются друг на друга: есть и грустные, и радостные треки во всех категориях популярности. Это визуально показывает отсутствие явной связи между эмоциональным «весельем» трека и его успехом.

Из этого анализа следует, что: - популярность слабо зависит от танцевальности и позитивности; - акцент на чисто инструментальной и чрезмерно энергичной музыке снижает шансы трека; - смещение в сторону более акустического звучания визуально коррелирует с большей популярностью.

Средняя популярность по жанрам

Теперь, когда мы увидели, что отдельные аудиохарактеристики слабо связаны с популярностью, можно посмотреть на жанры. Столбчатый график показывает топ‑жанры по средней популярности и позволяет сравнить их между собой в одной шкале.

Original size 3569x1769

Приходим к следующим выводам: 1. Жанры сильно различаются по средней популярности: одни (например, british, acoustic) набирают значения около 40+ баллов, тогда как другие (например, bluegrass) остаются в районе 20–30. Разрыв превышает 30 пунктов, то есть одни жанры в среднем более чем в два раза успешнее других. 2. В верхней части графика находятся жанры с акцентом на вокал и мелодию, а в нижней — более электронные и инструментальные направления. Это визуально подтверждает, что платформа лучше «поддерживает» слушательские, а не клубные жанры. 3. Разница между столбцами по жанрам во много раз превосходит эффекты отдельных аудиохарактеристик. Глядя на график, становится очевидно: для популярности важнее выбрать «правильный» жанр, чем тонко настраивать энергию или танцевальность внутри «неудобного» жанра.

Вывод

Именно жанр — главный фактор популярности, и вот почему:

1. Разница средней популярности между жанрами очень заметна, тогда как аудиохарактеристики по отдельности дают корреляции порядка 0.1–0.15 и объясняют менее 3% разброса популярности.

2. Жанр одновременно «обгоняет» и звучание (вокал/инструментал, акустичность, энергию), и контекст использования (клуб, наушники, фон). Вокальные, мелодичные жанры (как british) идеально подходят под типичный сценарий Spotify, поскольку треки слушаются на ходу.

3. Даже когда энергия, инструментальность или акустичность показывают закономерные тренды, эти эффекты невелики и не могут компенсировать выбор изначально «неудобного» жанра.

Итог: на Spotify важнее всего к какому жанру он принадлежит и подходит ли этот жанр под реальный сценарий использования платформы. Жанр задаёт базовый уровень популярности, а аудиохарактеристики лишь слегка его корректируют.

В проекте была использована нейросеть: SDXL Lightning для обложки

Ссылка на базу данных и код: https://disk.360.yandex.ru/d/XAeY0puIFynv-g