
Описание проекта
Каждый из нас каждый день так или иначе сталкивается с музыкой, будь то плейлист в наушниках, радио в такси, фон в общественном транспорте, или же просто бродячий музыкант в подземном пешеходном переходе. Тем интереснее становится изучение тенденций популярности тех или иных жанров/исполнителей с течением времени. Для изучения этого вопроса, я остановилась на одном из самых популярных музыкальных стриминговых сервисов — Spotify. В качестве объекта исследования я выбрала датасет на сайте Kaggle, содержащий в себе данные по музыкальным трендам с 2009 по 2025 годы.
Целью моей работы было выявить самые популярные жанры/исполнителей, а также общую статистику платформы. В рамках проекта я использовала гистограммы, круговые, столбчатые и линейчатые диаграммы, а также облако слов.
Подготовка

Для начала нужно было подгрузить библиотеки, датасет и определиться со стилистикой графиков. Так как данные собраны на сервисе Spotify, я решила использовать зеленую палитру для оформления.
Анализ общей структуры данных

Я решила рассмотреть обезличенную статистику. Первое, что было для меня интересно, это посмотреть, какое количество треков было выпущено синглом, а какое альбомом. Для этого построила круговую диаграмму.

Как мы видим, почти 70% композиций являются альбомными, а синглы выпускаются исполнителями в 2,7 раз реже.

Далее я рассмотрела распределение артистов по средней популярности (метрика Spotify). Это позволяет нам утверждать, что несмотря на то, что большинство слушателей предпочитают одних и тех же исполнителей, существует значительный (около 10% от общего количества) массив исполнителей с популярностью до 40 пунктов.

Также я решила обратить внимание на длительность публикуемых композиций. Для этого я использовала гистограмму с длительностью в минутах по оси абсцисс и количеством треков по оси ординат. Как мы видим, большинство треков соответствуют длительности чуть более 3,5 минут, а самые длинные композиции могут быть с вами более 10 минут!
Анализ исполнителей

Далее я начала анализировать конкретных исполнителей. Для начала выделила тех, кто выпустил наибольшее количество композиций. Ожидаемо, с огромным отрывом лидирует Мисс Американа.

Далее я решила посмотреть, какие артисты были самыми активными в каждый год. Годами-рекордсменами оказались 2017 и 2021, в обоих главным контент-мейкером оказалась Taylor Swift.

Также я решила посмотреть, какие артисты были самыми популярными в каждый анализируемый временной промежуток.
Анализ жанров

Мне стало интересно, какие жанры являются самыми популярными на платформе. Сначала я написала функцию парсинга жанров из датасета, а потом выделила топ-15 самых часто упоминаемых из них.
Итоги

Благодаря проведенному анализу, я выяснила, что Spotify — многосторонняя платформа, на которой могут найти музыку себе по душе как и любители мейнстримных направлений, таких как поп или ритм-н-блюз, так и фанаты нишевых исполнителей. Однако, мы видим, что подавляющее большинство слушателей сконцентрировано на поп-музыке, и англоязычные исполнители являются самыми популярными во всем мире.
Описание применения генеративной модели
В рамках проекта использовался ИИ Deepseek для составления элементов кода. https://www.deepseek.com/en