Описание
Sanrio — японская компания, признанный мировой лидер в разработке и лицензировании персонажей, основанная в 1960 году. Является создателем культовой Hello Kitty и сотен других героев (Cinnamoroll, Gudetama, Aggretsuko и др.), которые стали неотъемлемой частью глобальной поп-культуры. Бизнес Sanrio строится на продаже эмоций через мерчандайз, что привело к формированию многомиллионного фандома по всему миру.
Sanrio каждый год проводит голосование на любимого персонажа, в данном проекте я использовала открытый датасет на kaggle, в котором можно найти информацию за 1986-2024 о рангах персонажей.
Визуальное оформление
Для визуализации данных я планирую использовать следующие типы графиков:
Линейный график — динамика позиций топ-5 персонажей за все время Тепловая карта — плотность популярности по десятилетиям Столбчатая диаграмма — самые стабильные персонажи Точечный график (scatter plot) — связь между годом дебюта и успехом в рейтингах
Также была подобрана палитра с самих персонажей Sanrio
Начало работы
Обработка и подготовка данных выполнялась в Pandas. Все математические расчеты, включая построение линий тренда, проведены с помощью NumPy. Визуализация результатов построена на связке Matplotlib (базовые графики) и Seaborn (стилизация и сложные диаграммы, такие как тепловая карта). Статистическая проверка гипотез, включая t-критерий, выполнена с использованием модуля SciPy Stats. Это обеспечило строгость и объективность сделанных выводов.
import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from scipy import stats import warnings warnings.filterwarnings ('ignore')
df = pd.read_csv ('/content/sanrio_rankings.csv')
Линейный график
Линейные графики идеально подходят для показа изменений во времени. Здесь мы наглядно видим, как менялись позиции персонажей на протяжении 40 лет. Этот график сразу отвечает на главный вопрос исследования: «Кто и когда был лидером?» и визуально драматизирует момент смены эпох (уход Hello Kitty, восход Cinnamoroll).
Тепловая карта
Тепловая карта позволяет сжать большие массивы данных и увидеть общую картину. Вместо того чтобы смотреть на 40 лет по отдельности, я объединила годы в десятилетия. Цвет ячейки мгновенно показывает, какой персонаж правил в каждую эпоху (чем светлее цвет, тем лучше его среднее место). Это идеальный инструмент для выявления долгосрочных трендов и «золотых веков» конкретных персонажей.
Столбчатая диаграмма
Горизонтальная столбчатая диаграмма лучше всего подходит для сравнения категорий (в данном случае — разных персонажей) по одному числовому показателю. Длина столбика наглядно показывает, кто был главным фаворитом, появляясь в топ-10 чаще других. Это ответ на вопрос: «Кто является самой (стабильной) звездой Sanrio по версии фанатов?».
Точечный график
Точечная диаграмма позволяет исследовать взаимосвязь между двумя величинами. Здесь я смотрела, есть ли связь между «возрастом» персонажа (сколько лет прошло с его дебюта) и его успехом (местом в рейтинге). Добавив линию тренда, я смогла увидеть общую закономерность: например, что новые персонажи в последние десятилетия добиваются успеха быстрее, чем классические. Размер точек показывает, как часто персонаж попадал в топ-10 в этот период, добавляя еще одно измерение данных.
Выводы
Смена династии подтверждена статистически. Cinnamoroll демонстрирует устойчивый рост с 2015 года В 2020–2024 годах его средний рейтинг (2.1) значительно лучше, чем у Hello Kitty (4.8).
В 90-х годах в топ-10 попадало максимальное количество уникальных персонажей. Hello Kitty, Keroppi и Pochacco доминировали в это десятилетие.
Cinnamoroll (дебют в 2002) и Kuromi (дебют в 2005) — главные персонажи 2000-х. Gudetama (дебют в 2013) — единственный новый персонаж 2010-х, закрепившийся в топ-5.
Hello Kitty — 39 лет в топ-10 (рекорд). My Melody — 38 лет Keroppi и Pochacco — более 30 лет. Эти персонажи формируют «стабильных любимчиков» фандома.
Cinnamoroll достиг топ-3 всего через 3 года после дебюта. Kuromi — через 5 лет. Gudetama — через 4 года. Современные персонажи добиваются успеха быстрее, чем классические.
Описание применения генеративной модели
Для поиска и решения проблем был использован DeepSeek
Материалы



