Концепция
Я выбрала эту тему, потому что это один из культовых сериалов 2000, который до сих пор имеет большую аудиторию и вызывает интерес у зрителей разных возрастов. Мне было интересно посмотреть, как менялось восприятие сериала с течением времени: какие эпизоды считались лучшими, а какие — менее популярными, и как различалась оценка зрителей по сезонам.
Кроме того, сериал богат на персонажей и сюжетные линии, что позволяет анализировать рейтинги не только по сериям, но и по сезонам, а также выявлять интересные тенденции и закономерности.
Типы диаграмм
Для визуализации я решила использовать линейные графики, гистограммы, столбчатые и круговые диаграммы, чтобы показать:
— динамику рейтингов по эпизодам и сезонам — распределение оценок зрителей — долю популярных и менее популярных серий
Визуальный стиль и цветовая палитра
Для визуализации данных была выбрана единая цветовая палитра в мягких пастельных оттенках. Такое решение позволяет снизить визуальную нагрузку, сделать графики более спокойными и единообразными, а также подчеркнуть аналитический характер проекта. Все визуализации выполнены в одном стиле: светлый фон, одинаковые оттенки и единая логика оформления. Цвета и стилизация задавались программно с помощью библиотек Matplotlib и Seaborn
График 1
Динамика рейтингов эпизодов по сезонам
Линейный график позволяет проследить, как менялись рейтинги эпизодов внутри каждого сезона и сравнить сезоны между собой.
График 2
Распределение рейтингов эпизодов
Гистограмма показывает, какие значения рейтингов встречаются чаще всего. Это помогает понять общее качество сериала с точки зрения зрителей.
График 3
Средний рейтинг по сезонам
Столбчатая диаграмма используется для сравнения сезонов по среднему рейтингу эпизодов.
График 4
Соотношение эпизодов с высоким и низким рейтингом
Круговая диаграмма показывает долю эпизодов с рейтингом выше и ниже 8 баллов
Используемые статистические методы
В ходе анализа были применены: - вычисление среднего и медианного значения рейтингов - анализ распределения данных - корреляционный анализ между рейтингом эпизода и количеством оценок
Вывод
Сериал в целом имеет высокие зрительские оценки, а ранние сезоны особенно популярны. Визуализация позволяет наглядно увидеть динамику рейтингов, распределение оценок и различия между сезонами. Применение единых цветов и стиля делает графики читабельными и гармоничными. Проект демонстрирует владение инструментами анализа данных и визуализации, а также понимание эстетики инфографики
В ходе работы над проектом были выполнены следующие этапы
Выбор и подготовка данных Использовался CSV-файл с информацией о сериях сериала: номера эпизодов, сезоны, рейтинги IMDb и количество оценок. Проведена очистка данных: заполнены пропуски, даты приведены к формату datetime. Анализ данных и визуализация Построены 4 графика разных типов Все графики выполнены в единых оттенках цветовой палитры, что обеспечивает визуальную гармонию и профессиональный стиль. Статистический анализ Рассчитан средний и медианный рейтинг эпизодов. Проведён корреляционный анализ между рейтингом и количеством оценок. Выявлено, что ранние сезоны имеют более стабильные и высокие оценки, а популярные эпизоды чаще имеют рейтинг выше 8. Стилизация графиков Использована единая цветовая палитра, заданная программно через Seaborn. В работе над этим проектом я использовала несколько генеративных моделей как вспомогательные инструменты. ChatGPT и для генерации самой обложки проекта использовалась модель ideogram.ai. promt: A dramatic and stylish scene inspired by Desperate Housewives Season 5 cover, showing four glamorous women standing with their backs to the viewer, wearing elegant red dresses, long hair flowing, cinematic lighting, moody suburban background, photorealistic, vibrant colors, high detail
Ссылка на датасет и блокнот



