Original size 1472x1840

Проект по анализу данных: Фильмы и сериалы Netflix

The project is taking part in the competition

Вводная часть

Я очень люблю смотреть фильмы и сериалы. Netflix для меня — как огромная видеотека, где всегда есть что посмотреть. Мне стало интересно: а что вообще есть в этой библиотеке? Откуда берутся все эти фильмы и сериалы? Какие жанры самые популярные? Из каких стран приходит больше всего контента?

Я решила изучить эти данные, чтобы понять: 1. Как менялся Netflix за последние годы 2. Что чаще добавляют — фильмы или сериалы 3. Из каких стран приходят самые интересные проекты 4. В какое время года выходит больше всего новинок

Типы графиков:

Типы графиков 1. Гистограмма — распределение контента по годам добавления 2. Линейный график — динамика добавления контента по месяцам 3. Круговая диаграмма — распределение по типам (фильмы/сериалы) 4. Горизонтальная гистограмма — топ-10 стран производства 5. Тепловая карта — активность добавления контента по годам и месяцам

Этапы работы:

post

Ключевые технологии: Pandas — работа с таблицами Matplotlib — создание графиков Seaborn — улучшение графиков NumPy — математические операции KaggleHub — загрузка данных, импортируем отдельным кодом с проверкой данных

post

Цветовая схема: Основной: красный Netflix (#E50914) Акценты: синий, мятный, оранжевый Текст: чёрный (#221F1F) Фон: белый и светло-серый

Также сделала удобный формат просмотра, чтобы графики показывались один за другим. После каждого графика нужно нажать Enter для продолжения. Код каждого графика достаточно объёмный, так как я добавляла оформление букв с цифрами в официальном формате Netflix, с приятной визуализацией в виде кода

Original size 2560x1294

Распределение контента Netflix по годам добавления. График построен с 2008 по 2021 год. Гистограмма

Original size 2560x1260

Динамика добавления контента Netflix по месяцам. Линейный график Самый активный: Июль Самый тихий: Февраль Среднее в месяц: 726

Original size 1734x1832

Распределение контента Netflix по типам. Круговая диаграмма Из 8709 записей мы видим, что преобладают фильмы (70,4%), остальные 29,6% — сериалы

Original size 2560x1634

Топ-10 стран по производству контента Netflix. Горизонтальная гистограмма Большее количество вкладывают USA, India и UK

Original size 2532x1562

Активность добавления контента Netflix по годам и месяцам. Тепловая карта Всего 8709, из них пиковый месяц был июль 2021- 257 записей

Для работы использовался ИИ Claude AI. Модель: Claude-3 Opus Платформа: https://claude.ai

Как я применяла ИИ:

1. Генерация идей по цветовым палитрам — получение рекомендаций по сочетанию цветов, основанных на брендинге Netflix 2. Оптимизация кода визуализации — помощь в создании более эффективного кода для matplotlib 3. Советы по композиции графиков — рекомендации по расположению элементов для лучшей читаемости 4. Статистический анализ — помощь в выборе подходящих статистических методов

Один из промптов, использованных в работе:

«Мне нужно создать визуализацию данных Netflix с фирменной цветовой палитрой. Основной цвет — Netflix red (#E50914). Предложите гармоничную палитру из 5-8 цветов, которая будет хорошо смотреться вместе с основным красным. Также дайте рекомендации по применению этих цветов в разных типах графиков.»

Рекомендованная палитра для Netflix: 1. #E50914 — основной красный (для акцентов) 2. #B81D24 — темно-красный (для вторичных элементов) 3. #221F1F — черный (для текста) 4. #F5F5F1 — светлый (для фона) 5. #FF6B6B — кораллово-красный 6. #118AB2 — синий океана (для контраста)

Применение: - Основной красный: заголовки, важные линии на графиках - Темно-красный: заполнение столбцов гистограмм - Светлый: фон графиков - Синий: для дополнительных линий на графиках

Главные выводы с проекта:

Мы просто взяли данные о фильмах и сериалах Netflix и посмотрели на них под разными углами. Получилась целая история: как платформа росла, что выходит чаще — фильмы или сериалы, из каких стран приходит больше всего контента.

Теперь я могу сделать так же с любыми другими данными. Захочу разобраться с трендами в музыке, игровой индустрии или бизнесе — схема одна и та же. Найти данные, почистить их, построить графики и сделать выводы. Это полезный скилл.

Мы превратили скучные таблицы в понятные графики и истории. И главное — научились этому процессу. Теперь я могу повторить это с любой другой темой, которая меня заинтересует.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more