
Описание
С сайта Kaggle я скачала датасет, содержащий топ 1000 фильмов IMDB за все время с некоторыми характеристиками, такими как жанры фильма, год выпуска, его рейтинг, его бюджет и так далее. Мне было интересно взять для анализа что-то связанное с кино, потому что я слежу за развитием этой индустрии, а также много его смотрю. Мною были проанализированы в основном характеристики, связанные с жанрами фильмов, были построены следующие графики: — линейные; — столбчатые; — круговая диаграмма. Эти типы графиков лучше всего подходили для решения нужных мне задач. В качестве основы для оформления я брала цветовую палитру Pyton Set3, все цвета были взяты из нее. Я постаралась визуализировать не слишком нагроможденные и удобные для понимания графики.
Анализ и визуализация
Изначально мне хотелось узнать самые часто встречающиеся жанры среди тысячи лучших фильмов, поэтому я построила столбчатый график, оставив на нем только 5 самых популярных жанров.

Код 1

Получившийся график
На графике наглядно видно, что фильмов с жанром «Drama» больше всего. Меня заинтересовал жанр комедии, и я захотела посмотреть, как менялось количество лучших фильмов этого жанра по годам.
Код 2
График 2
После этого я решила сравнить получившийся результат с самым популярным жанром — драмой. Для этого на предыдущий график я добавила еще одну кривую, а также легенду, чтобы различить жанры.
Код 3
График 3
После этого мне стало интересно, как жанры соотносятся с рейтингом фильма. Так как в датасете собраны лучшие фильмы, то и рейтинг у всех них был высокий, поэтому я решила определить соотношение жанров, получивших оценку больше 8.5. Итак, я построила круговую диаграмму, показывающее распределение фильмов, имеющих рейтинг более 8.5, по жанрам.
Код 4
График 4
Я предполагала, что наиболее популярный жанр — драма — и будет получать наивысшие оценки, однако оказалось, что жанр «Western» имеет более высокий процент рейтинга больше 8.5. Возможно, это связано с количеством фильмов этих жанров, несмотря на то, что я считала долю именно в процентах.
Описание применения генеративной модели
В работе я иногда пользовалась ChatGPT для правильного синтаксиса при написании кода. Я указывала в промпте четкие указания пошагово, с помощью этого получая четкий и решающий мою задачу результат.


Промпты
Также при помощи Bing Copilot GPT была сгенерирована обложка для данного проекта.
Промпт