
Концепция проекта
Этот проект родился из моей любви к мультсериалу «Hilda» от Netflix — ещё на первом курсе я создавала настольную игру и анимацию в его стиле, а теперь превратила эту эстетику в ИИ-инструмент для всех, кто хочет творить в этом уютном мире.
Я хотела бы, чтобы эта модель стала не просто генератором картинок, а настоящим творческим «соавтором», который вдохновляет и поддерживает.
Я надеюсь, что этот проект, эта модель поможет художникам преодолеть страх чистого листа, предоставляя новые идеи через неожиданные генерации и сохраняя магию рукотворного стиля мультсериала. Эта модель может стать источником вдохновения для концепт-артов, референсов и даже создания комиксов или раскадровок.
Пусть эта обученная модель станет инструментом, который вдохновит на эксперименты и позволит взглянуть на привычные вещи под новым углом, превращая любимую эстетику в неисчерпаемый источник креативности и новых открытий.
Исходные изображения

коллаж из примеров исходных изображений
Для обучения модели я собрала оригинальный датасет из 90 скриншотов мультсериала «Хильда», полученных с платформ Fancaps и Pinterest.
Все изображения прошли предварительную обработку: • Приведение к квадратному формату (соотношение 1:1) • Единообразное уменьшение разрешения до 512×512 пикселей • Визуальная проверка, чтобы персонажи были кадрированы аккуратно и по центру, чтобы не было намешано ничего лишнего.

собранный датасет для обучения, 90 скриншотов
Процесс обучения
Работа началась с использования предоставленного нам учебного шаблона для нейросетевого обучения.
После подготовки датасета я приступила к обучению модели, чтобы она могла создавать изображения в стиле мультсериала.
датасет успешно подключен
нейросеть понимает, что изображено на исходных изображениях
обучение модели, пробные генерации
Процесс обучения и генерации стал для меня увлекательным экспериментом, где технологии и искусство переплелись, открывая новые возможности для творчества и вдохновения, поиска референсов.
Этот опыт позволил мне не только глубже понять работу нейросетей, но и создать неплохой инструмент, способный интерпретировать невероятную эстетику «Хильды» через призму ИИ.
Первые эксперименты
При начальном тестировании модели был использован базовый промт: «art in HILDA style, a blue-haired, smiling, happy girl» num_inference_steps=25
Результат генерации оказался вполне ожидаемым: множество артефактов, несовершенная анатомия персонажа, асимметрия черт лица, а также абстрактный фоны. Всё это возникло из-за малого числа шагов и поверхностного промта.
Однако всё равно считывается знакомая цветовая палитра, форма волос, нос. Генерация уже отдаленно походит на стилистику мультсериала, что является хорошим знаком.
самое первое сгенерированное изображение
Важно отметить, что качество изображений было улучшено с помощью апскейлинга в соответствующих программах.
вторая генерация, параметр num_inference_steps повышен
третья генерация с улучшенным промтом, num_inference_steps = 40
Третья и четвертая генерации демонстрируют наиболее точное соответствие стилистике мультсериала «Хильда».
На этих изображениях четко прослеживаются ключевые элементы фирменного визуального языка: • Характерные упрощенные формы персонажей, схожие формы глаз, носа • Выразительные толстые контуры • Сдержанная природная палитра (охристые, болотно-зеленые и небесно-голубые тона) • Минималистичная проработка теней и текстур
четвертая генерация с новым промтом была кадрирована и выбрана в качестве обложки
Популярные персонажи в мире мультсериала
Микки Маус в мире «Hilda»
В рамках одного из первых тестирований возможностей обученной модели я провела эксперимент по адаптации известных анимационных персонажей — Микки Мауса (Disney) и Эльзы (Frozen) — в стилистике мультсериала.
Эльза в мире «Hilda»
Серия генераций на различные темы
генерация мужских персонажей
разные промты (с рюкзаком и без него), но результат получился очень похожим
Анализ сгенерированных изображений показывает, что модель успешно комбинирует характерные черты разных персонажей из обучающего датасета. Она успешно усвоила и передала основные стилевые особенности.
в сгенерированных изображениях прослеживаются черты многих персонажей датасета
Продолжая экспериментировать, я создала автопортреты в стиле мультсериала.
Для достижения оптимального результата я: 1. Постепенно увеличивала параметр num_inference_steps (от 30 до 50 шагов), что позволило мне получить более детализированное изображение. 2. Точно настраивала guidance_scale (в диапазоне 7-10), балансируя между креативностью и соответствием стилю.
пробы автопортрета
Kaggle и Hugging Face
слева: генерация в Kaggle | справа: генерация в Hugging Face
В ходе работы с генерацией изображений в стиле мультсериала на платформах Kaggle и Hugging Face мною были выявлены их особенности.
Kaggle обеспечивает достаточно детализированную прорисовку фонов, соблюдение цветовой палитры оригинала, стабильную интерпретацию текстовых запросов и сохранение характерных стилевых элементов, а именно толстого контура, лайна.
Hugging Face предлагает более мягкую, «акварельную» обработку изображений, в особенности это касается фонов. Также имеется большая вариативность в интерпретации промтов, специфическая работа с освещением и текстурами.
генерация в Hugging Face, один промт — разные результаты, от худшего к лучшему
крайне необычная и красивая генерация в Hugging Face, почти без артефактов
Заключение
Этот проект стал увлекательным экспериментом, демонстрирующим, как генеративные модели могут адаптироваться под уникальный стиль мультсериала «Хильда». Он не только показал возможность точного воспроизведения ключевых художественных элементов — от упрощённой анатомии персонажей до приглушённой природной палитры, — но и открыл перспективы для дальнейшего развития.
Модель может вдохновлять художников, аниматоров и комиксистов, помогая создавать удобные референсы, концепт-арты и раскадровки в стильной и узнаваемой стилистике. Это подтверждает, что нейросети способны не просто имитировать, но и развивать анимационные стили, открывая новые горизонты для творчества и вдохновения.
Описание применения генеративной модели
Для создания изображений в стиле мультсериала «Хильда» была использована генеративная модель Stable Diffusion. Формулировка идей и генерация большинства промптов проводились с помощью DeepSeek и GPT-4o, что позволило добиться большей точности и вариативности в интерпретации запросов. Для повышения качества итоговых изображений мной применялся инструмент Upscayl, который улучшил детализацию и разрешение генерируемых работ.