
Для анализа я выбрала датасет с сервиса Яндекс.Музыка, в котором собрана информация о топ-100 треках. Данные были получены с помощью веб-скрейпинга и включают такие параметры, как название трека, продолжительность, жанр, исполнитель (и), позиция в чарте, количество ежемесячных прослушиваний и лайков исполнителя.
Эта тема показалась мне интересной, потому что я сама регулярно слушаю музыку на стриминговых сервисах и мне было любопытно разобраться, какие жанры доминируют в чартах Яндекс.Музыки и какие факторы влияют на популярность треков.
Для иллюстрации данных я использовала диаграммы и графики, которые наиболее наглядно показывают информацию:
Для обложки я использовала нейросеть Midjourney
Promt: «Mid shot, side view: A young woman wearing large headphones, eyes closed, fully immersed in the music. Her silhouette seamlessly blends with an atmospheric cityscape filled with neon lights, misty streets, and distant skyscrapers. The color palette is soft and pastel, with warm reflections of the sunset. Deep cinematic composition, professional lighting, 8K detail, soft focus, meditative atmosphere., . Her hair shimmers with neon shades of yellow (#FFC403, #EAEE00), orange (#FD6607), purple (#D500F9, #FD50FA), blue (#50BDFD, #2979FF, #1E2BE5), and deep violet (#6800D0, #FF22B5).»
Цветовая палитра
Я выбрала яркую, контрастную и энергичную палитру, которая идеально подчёркивает тематику музыкального чарта, делает графики стильными и легко читаемыми на тёмном фоне

Работа
Я установила необходимые библиотеки: Pandas для обработки данных, Matplotlib и Seaborn для визуализации. Затем импортировала их в файл, чтобы использовать в дальнейшем анализе.
После этого я загрузила датасет Yandex Music Top 100, провела предварительную обработку данных и приступила к их анализу и визуализации
Открыла датасет с информацией о топ-100 треках Yandex Music
Проверила наличие пропущенных значений и обработала их
Изучила распределение треков по жанрам, а также другие ключевые параметры, такие как популярность артистов и количество прослушиваний
Привела данные к удобному для анализа формату, подготовив их к визуализации
Визуализация данных
Для начала надо было узнать соотношение различных жанров в топ-100 треках
Анализ показал, что русский реп доминирует в чарте, занимая больший процент от общего числа треков. Это говорит о том, что данный жанр наиболее востребован у слушателей, в то время как русский рок, гиперпоп, индастриал, хаус и кавказская музыка встречаются значительно реже и скорее всего на любителя
Затем важно было понять и сравнить количество треков разных жанров в чарте
Русский реп и русская поп-музыка имеют наибольшее представительство в чарте. Это может говорить о том, что музыкальные предпочтения пользователей ориентированы именно на эти направления. Однако жанры русский рок, гиперпоп, индастриал, хаус и кавказская музыка представлены минимально, что может свидетельствовать либо о снижении их популярности, либо о том, что они реже попадают в топовые чарты
Дальше было интересно было рассмотреть статистику с токи зрения чартов, возможно это как-нибудь поменяло бы результаты. На графике я отобразила распределение жанров по позициям в чарте, чтобы выявить, какие жанры занимают лидирующие позиции
Интересно, что Русский реп чаще всего занимает лидирующие позиции в чарте, в то время как определенное количество чаще оказывается внизу списка. Это может говорить о том, что слушатели предпочитают определенные стили на первых местах, а менее популярные жанры занимают низшие позиции
Напоследок важно проанализировать зависимость между количеством ежемесячных прослушиваний и позицией трека в чарте, чтобы понять, как популярность трека влияет на его место в рейтинге
График демонстрирует явную тенденцию: чем выше позиция трека в чарте, тем больше у него ежемесячных прослушиваний. Однако встречаются исключения, где треки с относительно низкой позицией имеют большое количество прослушиваний — возможно, это вирусные хиты или релизы топовых артистов
Заключение
Выводы, которые можно сделать после анализа:
Некоторый код был исправлен с помощью ChatGPT