Вводная часть
Недавний всплеск интереса к «Оскару», благодаря первой в 21 веке номинации русского актера на эту награду — Юры Борисова — невозможно было не заметить. А фильм, за который Юра и попал в список номинантов, «Анора», и вовсе получил в итоге 5 наград в номинациях. Это, в свою очередь, породило массу споров о разнице в системе оценивания фильмов кинокритиками и обычными зрителями. Поскольку последние считали других номинантов более достойными, а саму «Анору» переоценённой экспертами.
Юра Борисов, Шон Бейкер, Майки Мэдисон, Карен Карагулян и Ваче Товмасян на Кинофестивале в Торонто // 2024 год // Frank Sun
Мне, как любителю кино, стало интересно узнать больше про самую престижную награду в мире кино и про ее, почти столетнюю, историю. Какой же жанр лучше снимать, чтобы с наибольшим шансом быть номинированным? А также интересно — насколько разнятся оценки внутри этих жанров от зрителей и от кинокритиков.
Я решил проанализировать датасет о фильмах. Для этого я нашел на Kaggle два набора данных: один о фильмах, другой — о номинантах на «Оскар». Поскольку в первом не было информации о наградах, а кинопремия меня интересует, я объединил их в один датасет. Было любопытно изучить различные тренды и статистику, особенно учитывая внушительный объем данных — около 40 тысяч строк.
Я постарался вместить на каждый график максимальное количество информации. Для этого были использованы тепловая карта, двойные, сложенные столбчатые и круговые диаграммы.
Этапы работы
Для начала мне нужно было объединить два .csv файла в один расширенный датасет. Я привел все названия фильмов к единому формату (все буквы в нижнем регистре) и добавил в датафрейм с фильмами два новых столбца. В столбце oscars содержится значение 1 — если фильм был номинирован, 2 — если выиграл, и 0 — если не получил номинацию. В столбце category указаны категории, на которые был номинирован фильм.
Позже я заметил, что в датасете слишком много жанров. Некоторые из них мне не подходили, например, анимация, короткометражки и записи концертов стендап-комиков. Также я удалил редкие жанры, которые мешали восприимчивости графиков, такие как спорт, гангстеры, эротика и экспериментальное кино.
Старт
С некоторыми более сложными графиками возникали проблемы, и я обращался к Deepseek за помощью с кодом. Также я поручил ему такие рутинные задачи, как выписывание оттенков в палитре matplotlib в диапазоне от желтого до красного.
Я решил оформить графики в цветах, которые ассоциируются с «Оскаром» и Голливудом — желтый и красный, как золотая статуэтка и красный ковер. Мне показалось, что эти цвета лучше смотрятся на черном фоне, и я также заменил шрифт на более изысканный.
Роберт Дауни-младший и Киран Калкин (левое фото), Скарлетт Йоханссон (правое фото) на фоне фирменных, для «Оскара», цветов // 2025 // Майк Коппола
Итоговые графики
При сравнении оценок меня удивило, что средние оценки критиков и зрителей оказались так близки — практически одинаковыми, с максимальной разницей в 0,3. В любом случае, на этом графике интересно проследить, какие жанры оцениваются выше — и, как оказалось, это в основном более «серьезные» жанры: нуар, документальные и военные фильмы.
После этого я захотел увидеть, как зрители оценивают фильмы, и создал этот график. Можно заметить, как мало оценок 1-2 и 9-10, но это вполне логично. Очень плохой фильм, как и очень хороший, сложно снять. А чуть больше половины всех фильмов были оценены на 6 или 7 из 10.
Затем я рассортировал фильмы по декадам, так как хотел исследовать исторические тренды. По графику видно, что драмы и комедии всегда доминировали, но также можно сделать более тонкие наблюдения. Вестерн быстро поднялся на вершину, но так же стремительно упал в конце 70-х. Приключенческие и шпионские фильмы в 60-е были довольно популярны, однако сейчас у них сильный спад. Мьюзиклы давно вышли из моды, но сейчас находятся на небольшом подъеме.
И, наконец, я использовал данные об «Оскарах». Интересно, как стремительно увеличивалось и продолжало расти количество номинантов. Легко выделить любимые жанры академии: это конечно же, драма, а также комедии и триллеры.
Еще я обнаружил, что можно составить облако слов, и в датасете как раз были колонки с описаниями фильмов и заметками. Результат получился интересным — отчетливо выделяется тема человеческих отношений, а также глаголы, такие как begin, decide, find, work.
Леонардо Ди Каприо с «Оскаром» // 2016 год // Анджела Вайс
Итоги
Как оказалось, оценки критиков и зрителей чаще всего практически идентичны. Если критикам свойственно обращать внимание на художественную ценность, качество и оригинальность сюжета. То для зрителя важнее эмоциональный отклик, благодаря которому он может спокойно «закрыть глаза» на всю вторичность. Однако действительно высококлассное кино сочетает и качество и эмоции, делая разницу в оценках двух «лагерей» минимальной.
Самими доминантными жанрами, по сумме аспектов, стали драма и комедия. Их номинируют чаще остальных, снимают и смотрят чаще остальных, а оценки для этих жанров являются одними из лучших. Так что, если хотите быть номинированным на «Оскар», все просто — снимайте драму или снимайтесь в ней.
Использование генеративного ИИ
Deepseek — дебаг кода, разбор ошибок, выписывание оттенков в палитре.



