Original size 940x1280

HildAI | Обучение генеративной нейросети под стиль мультсериала «Hilda»

Концепция проекта

Этот проект родился из моей любви к мультсериалу «‎Hilda» от Netflix — ещё на первом курсе я создавала настольную игру и анимацию в его стиле, а теперь превратила эту эстетику в ИИ-инструмент для всех, кто хочет творить в этом уютном мире.

Я хотела бы, чтобы эта модель стала не просто генератором картинок, а настоящим творческим «соавтором», который вдохновляет и поддерживает.

Я надеюсь, что этот проект, эта модель поможет художникам преодолеть страх чистого листа, предоставляя новые идеи через неожиданные генерации и сохраняя магию рукотворного стиля мультсериала. Эта модель может стать источником вдохновения для концепт-артов, референсов и даже создания комиксов или раскадровок.

Пусть эта обученная модель станет инструментом, который вдохновит на эксперименты и позволит взглянуть на привычные вещи под новым углом, превращая любимую эстетику в неисчерпаемый источник креативности и новых открытий.

Исходные изображения

Original size 2433x1221

коллаж из примеров исходных изображений

Для обучения модели я собрала оригинальный датасет из 90 скриншотов мультсериала «Хильда», полученных с платформ Fancaps и Pinterest.

Все изображения прошли предварительную обработку: • Приведение к квадратному формату (соотношение 1:1) • Единообразное уменьшение разрешения до 512×512 пикселей • Визуальная проверка, чтобы персонажи были кадрированы аккуратно и по центру, чтобы не было намешано ничего лишнего.

Original size 1767x1015

собранный датасет для обучения, 90 скриншотов

Процесс обучения

Работа началась с использования предоставленного нам учебного шаблона для нейросетевого обучения.

После подготовки датасета я приступила к обучению модели, чтобы она могла создавать изображения в стиле мультсериала.

Original size 1239x546

датасет успешно подключен

Ссылка на код

нейросеть понимает, что изображено на исходных изображениях

Ссылка на Hugging Face

обучение модели, пробные генерации

Процесс обучения и генерации стал для меня увлекательным экспериментом, где технологии и искусство переплелись, открывая новые возможности для творчества и вдохновения, поиска референсов.

Этот опыт позволил мне не только глубже понять работу нейросетей, но и создать неплохой инструмент, способный интерпретировать невероятную эстетику «Хильды» через призму ИИ.

Первые эксперименты

При начальном тестировании модели был использован базовый промт: «art in HILDA style, a blue-haired, smiling, happy girl» num_inference_steps=25

Результат генерации оказался вполне ожидаемым: множество артефактов, несовершенная анатомия персонажа, асимметрия черт лица, а также абстрактный фоны. Всё это возникло из-за малого числа шагов и поверхностного промта.

Однако всё равно считывается знакомая цветовая палитра, форма волос, нос. Генерация уже отдаленно походит на стилистику мультсериала, что является хорошим знаком.

Original size 1280x1280

самое первое сгенерированное изображение

Важно отметить, что качество изображений было улучшено с помощью апскейлинга в соответствующих программах.

Original size 1280x1280

вторая генерация, параметр num_inference_steps повышен

Original size 1280x1280

третья генерация с улучшенным промтом, num_inference_steps = 40

Третья и четвертая генерации демонстрируют наиболее точное соответствие стилистике мультсериала «Хильда».

На этих изображениях четко прослеживаются ключевые элементы фирменного визуального языка: • Характерные упрощенные формы персонажей, схожие формы глаз, носа • Выразительные толстые контуры • Сдержанная природная палитра (охристые, болотно-зеленые и небесно-голубые тона) • Минималистичная проработка теней и текстур

Original size 940x1280

четвертая генерация с новым промтом была кадрирована и выбрана в качестве обложки

Популярные персонажи в мире мультсериала

Микки Маус в мире «Hilda»

В рамках одного из первых тестирований возможностей обученной модели я провела эксперимент по адаптации известных анимационных персонажей — Микки Мауса (Disney) и Эльзы (Frozen) — в стилистике мультсериала.

Эльза в мире «Hilda»

Серия генераций на различные темы

генерация мужских персонажей

разные промты (с рюкзаком и без него), но результат получился очень похожим

Анализ сгенерированных изображений показывает, что модель успешно комбинирует характерные черты разных персонажей из обучающего датасета. Она успешно усвоила и передала основные стилевые особенности.

Original size 2458x1221

в сгенерированных изображениях прослеживаются черты многих персонажей датасета

Продолжая экспериментировать, я создала автопортреты в стиле мультсериала.

Для достижения оптимального результата я: 1. Постепенно увеличивала параметр num_inference_steps (от 30 до 50 шагов), что позволило мне получить более детализированное изображение. 2. Точно настраивала guidance_scale (в диапазоне 7-10), балансируя между креативностью и соответствием стилю.

пробы автопортрета

Kaggle и Hugging Face

Original size 2433x1221

слева: генерация в Kaggle | справа: генерация в Hugging Face

В ходе работы с генерацией изображений в стиле мультсериала на платформах Kaggle и Hugging Face мною были выявлены их особенности.

Kaggle обеспечивает достаточно детализированную прорисовку фонов, соблюдение цветовой палитры оригинала, стабильную интерпретацию текстовых запросов и сохранение характерных стилевых элементов, а именно толстого контура, лайна.

Hugging Face предлагает более мягкую, «акварельную» обработку изображений, в особенности это касается фонов. Также имеется большая вариативность в интерпретации промтов, специфическая работа с освещением и текстурами.

Original size 2261x1221

генерация в Hugging Face, один промт — разные результаты, от худшего к лучшему

Original size 2048x2048

крайне необычная и красивая генерация в Hugging Face, почти без артефактов

Заключение

Этот проект стал увлекательным экспериментом, демонстрирующим, как генеративные модели могут адаптироваться под уникальный стиль мультсериала «Хильда». Он не только показал возможность точного воспроизведения ключевых художественных элементов — от упрощённой анатомии персонажей до приглушённой природной палитры, — но и открыл перспективы для дальнейшего развития.

Модель может вдохновлять художников, аниматоров и комиксистов, помогая создавать удобные референсы, концепт-арты и раскадровки в стильной и узнаваемой стилистике. Это подтверждает, что нейросети способны не просто имитировать, но и развивать анимационные стили, открывая новые горизонты для творчества и вдохновения.

Original size 2048x2048

Описание применения генеративной модели

Для создания изображений в стиле мультсериала «Хильда» была использована генеративная модель Stable Diffusion. Формулировка идей и генерация большинства промптов проводились с помощью DeepSeek и GPT-4o, что позволило добиться большей точности и вариативности в интерпретации запросов. Для повышения качества итоговых изображений мной применялся инструмент Upscayl, который улучшил детализацию и разрешение генерируемых работ.

HildAI | Обучение генеративной нейросети под стиль мультсериала «Hilda»

Svetlana Konstantinova

artificial intelligence

neural network

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...