Описание проекта
Spotify — один из самых популярных сервисов для прослушивания музыки. Благодаря ему каждый слушатель находит того исполнителя, который ему интересен, а исполнители получают шанс получить новых слушателей.
В Spotify, как и во всех других подобных сервисах, есть более прослушиваемые и популярные треки.
Есть ли какая-то закономерность во всех треках, которые попадают в топы и становятся популярными на этой платформе? Этот вопрос мучает многих слушателей и исполнителей, в том числе и меня.
Целью данного проекта является желание выявить возможные закономерности и паттерны в популярных песнях на Spotify, которые могут влиять на популярность песен. Анализ таких закономерностей может помочь лучше понять музыкальные тренды, а также выявить «формулу» успеха, которая может помочь начинающим исполнителям попадать в топ по прослушиваниям.
Проект делался с помощью базы данных «Spotify Songs Analytics Dataset» с сайта Kaggle.
Визуальные решения проекта
В качестве референса для проекта был выбран дизайн Spotify. Так, в проекте основными цветами являются оттенки зеленого, серого и белый.
Данная палитра будет использоваться во всем проекте.
Начало работы
Для начала импортируем все необходимые для работы библиотеки: Seaborn, Matplotlib, Pandas.
После этого задается палитра, которая будет использоваться в построении графиков.
Далее задаются глобальные стили оформления для всех графиков Matplotlib, чтобы эти графики имели единый стиль.
Финальный этап подготовки к написанию программ — чтение CSV файла (необходимая часть кода для начала работы с CSV файлом), преобразование столбца streams в числовой формат (для того, чтобы проводить числовые операции) и создание нового столбца streams_B (для более удобного сравнения).
Графики
Фасетная точечная диаграмма 1
На данной диаграмме показана зависимость количества стримов от числа плейлистов на платформах Spotify и Apple Music. Видно, что по мере роста количества плейлистов, в которых находится трек, увеличивается число его стримов (прослушиваний). Заметно, что после преодоления определенного порога, рост количества стримов ускоряется.
Фасетная точечная диаграмма 2
Данная диаграмма иллюстрирует общее количество стримов в Spotify и Apple Music. Чем больше суммарное количество плейлистов, тем выше популярность трека. Наиболее высокие значения стримов сосредоточены в правой верхней части диаграммы.
Несмотря на наличие некоторого разброса, общий тренд остаётся очевидным: количество плейлистов является важным фактором роста прослушиваний трека.
Боксплот
Данный боксплот показывает как часто треки становились популярными с 2000 года по 2025 год.
На графике видно, что начиная с 2020 года количество стримов популярных треков начало уменьшаться, медианные значения стримов популярных треков снижаются, а разброс значений становится еще более выраженным. Это может указывать на то, что стримы начали перераспределяться между большим числом треков.
Фасетная точечная диаграмма 3
На данной диаграмме представлена зависимость количества стримов от трех музыкальных характеристик: energy (энергичность), acousticness (акустичность) и liveness (вероятность того, что трек записан с живого выступления/с посторонними шумами).
Большинство наиболее популярных треков сосредоточено в диапазоне средних и высоких значений energy, а также при низких значениях acousticness и liveness, что указывает на преобладание студийных треков. Тем не менее, связь между тремя этими параметрами и количеством стримов почти полностью отсутствует: при схожих значениях energy, acousticness или liveness количество стримов может существенно различаться.
Линейный график 1
Данный график демонстрирует характеристик песен по временам года.
Видно, что такие параметры, как energy (энергичность) и danceability (танцевальность) демонстрируют выраженный рост в летний период, достигая максимальных значений по сравнению с другими сезонами. Valence (мера позитивности трека) достигает своего пикового значения зимой. Acousticness (акустичность) остается стабильной все сезоны, кроме лета, когда этот показатель заметно уменьшается. Liveness (вероятность того, что трек записан с живого выступления/с посторонними шумами) остается на стабильно низких значениях весь год, что дает понять, что эта характеристика никак не зависит о времени года.
Летом более энергичные, танцевальные и позитивные треки достигают пика своей популярности, тогда как зимой заметна тенденция к увеличению интереса к акустическим трекам. Это свидетельствует о том, что сезонность может играть роль в популярности треков, но учитывая то, что данные на графике не сильно меняются с каждым сезоном, можно сделать вывод о том, что сезонность не является основным фактором попадания в топы.
Линейный график 2
На графике показана динамика средних значений трёх музыкальных характеристик — energy, danceability и valence.
В начале 2000-х годов значения характеризуются высокой вариативностью. После, с наступлением EDM эры, значения начинают приходить к стабильным показателям.
Во время EDM эры (2007–2012) значения energy (энергичность) треков остаются по-прежнему высокими, а valence заметно возрастает.
Во время Streaming Boom эры (2013–2019) значения danceability остаются относительно стабильными, тогда как значения energy и valence постепенно снижаются.
Начиная с TikTok эры (2020), все три показателя вновь показывают рост, особенно energy и danceability.
Заключение
Исходя из данных, полученных в результате составления графиков, можно сказать, что несмотря на идею о наличии «формулы успеха», предполагаемой сильной закономерности между музыкальными характеристиками и популярностью треков выявлено не было. Аудиохарактеристики не являются основным фактором популярности треков и имеют тенденцию менять свою значимость в популярности со временем.
Ключевую роль в формировании популярности трека играет его присутствие в плейлистах. На графиках со сравнением количества стримов и количества плейлистов заметна эта тенденция — треки с большинством стримов встречаются в большом количестве плейлистов. Таким образом, попадание в плейлисты становится основным механизмом роста популярности.



