Original size 1140x1600

Музыка, которая правит чартами

PROTECT STATUS: not protected
14

Для анализа я выбрала датасет с сервиса Яндекс.Музыка, в котором собрана информация о топ-100 треках. Данные были получены с помощью веб-скрейпинга и включают такие параметры, как название трека, продолжительность, жанр, исполнитель (и), позиция в чарте, количество ежемесячных прослушиваний и лайков исполнителя.

Эта тема показалась мне интересной, потому что я сама регулярно слушаю музыку на стриминговых сервисах и мне было любопытно разобраться, какие жанры доминируют в чартах Яндекс.Музыки и какие факторы влияют на популярность треков.

Для иллюстрации данных я использовала диаграммы и графики, которые наиболее наглядно показывают информацию:

  1. Круговая диаграмма
  2. Столбчатая диаграмма
  3. Линейчатая диаграмма
  4. Линейный график

Для обложки я использовала нейросеть Midjourney

Promt: «Mid shot, side view: A young woman wearing large headphones, eyes closed, fully immersed in the music. Her silhouette seamlessly blends with an atmospheric cityscape filled with neon lights, misty streets, and distant skyscrapers. The color palette is soft and pastel, with warm reflections of the sunset. Deep cinematic composition, professional lighting, 8K detail, soft focus, meditative atmosphere., . Her hair shimmers with neon shades of yellow (#FFC403, #EAEE00), orange (#FD6607), purple (#D500F9, #FD50FA), blue (#50BDFD, #2979FF, #1E2BE5), and deep violet (#6800D0, #FF22B5).»

Цветовая палитра

Я выбрала яркую, контрастную и энергичную палитру, которая идеально подчёркивает тематику музыкального чарта, делает графики стильными и легко читаемыми на тёмном фоне

big
Original size 2378x1146

Работа

Начало работы:

Original size 1036x288

С помощью ChatGPT были добавлены доп настройки

Я установила необходимые библиотеки: Pandas для обработки данных, Matplotlib и Seaborn для визуализации. Затем импортировала их в файл, чтобы использовать в дальнейшем анализе.

После этого я загрузила датасет Yandex Music Top 100, провела предварительную обработку данных и приступила к их анализу и визуализации

Original size 930x108

Обработка данных:

Открыла датасет с информацией о топ-100 треках Yandex Music

Original size 2818x716

Провела предварительный анализ данных:

С помощью ChatGPT так же смогла провести анализ данных, чтобы не было никаких ошибок

Original size 806x596

Проверила наличие пропущенных значений и обработала их

Изучила распределение треков по жанрам, а также другие ключевые параметры, такие как популярность артистов и количество прослушиваний

Привела данные к удобному для анализа формату, подготовив их к визуализации

Визуализация данных

Первый этап

Для начала надо было узнать соотношение различных жанров в топ-100 треках

Original size 1706x1214

Код для круговой диаграммы

Original size 988x660

Анализ показал, что русский реп доминирует в чарте, занимая больший процент от общего числа треков. Это говорит о том, что данный жанр наиболее востребован у слушателей, в то время как русский рок, гиперпоп, индастриал, хаус и кавказская музыка встречаются значительно реже и скорее всего на любителя

Второй этап

Затем важно было понять и сравнить количество треков разных жанров в чарте

Original size 2168x1220

Код для столбчатой диаграммы

Original size 851x667

Русский реп и русская поп-музыка имеют наибольшее представительство в чарте. Это может говорить о том, что музыкальные предпочтения пользователей ориентированы именно на эти направления. Однако жанры русский рок, гиперпоп, индастриал, хаус и кавказская музыка представлены минимально, что может свидетельствовать либо о снижении их популярности, либо о том, что они реже попадают в топовые чарты

Третий этап

Дальше было интересно было рассмотреть статистику с токи зрения чартов, возможно это как-нибудь поменяло бы результаты. На графике я отобразила распределение жанров по позициям в чарте, чтобы выявить, какие жанры занимают лидирующие позиции

Original size 2082x1128

Код для линейной диаграммы

Original size 994x557

Интересно, что Русский реп чаще всего занимает лидирующие позиции в чарте, в то время как определенное количество чаще оказывается внизу списка. Это может говорить о том, что слушатели предпочитают определенные стили на первых местах, а менее популярные жанры занимают низшие позиции

Четвертый этап

Напоследок важно проанализировать зависимость между количеством ежемесячных прослушиваний и позицией трека в чарте, чтобы понять, как популярность трека влияет на его место в рейтинге

Original size 2360x1216

Код для линейного графика

Original size 865x557

График демонстрирует явную тенденцию: чем выше позиция трека в чарте, тем больше у него ежемесячных прослушиваний. Однако встречаются исключения, где треки с относительно низкой позицией имеют большое количество прослушиваний — возможно, это вирусные хиты или релизы топовых артистов

Заключение

Выводы, которые можно сделать после анализа:

  1. Русский реп доминирует в топах, а русский рок, гиперпоп, индастриал, хаус и кавказская музыка встречается редко.
  2. Треки с большим числом прослушиваний чаще оказываются на верхних позициях чарта, но есть исключения.
  3. Популярные артисты имеют стабильные позиции в чартах, но иногда новички могут выбиваться в топ, если их треки становятся вирусными

Некоторый код был исправлен с помощью ChatGPT

Музыка, которая правит чартами
14
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more