Исходный размер 1140x1600

Обучение генеративной модели Stable Diffusion под стиль смешариков

big
Исходный размер 848x222
big
Исходный размер 2144x258

Идеей моего проекта является обучение генеративной нейросети Stable Diffusion под стиль смешариков и дальнейшее ее использование с целью генерации уникальных изображений в этом стиле

big
Исходный размер 2144x258

Для обучения генеративной нейросети я собрала датасет, состоящий из 40 изображений

big
Исходный размер 2144x258

Данный код реализует обучение генеративной нейросети на основе предобученной модели Stable Diffusion, ориентируясь на стилистику смешариков

big
Исходный размер 597x392

На данном этапе происходит подготовка данных. Я создала папку «smeshariki», в которую копируются изображения для дальнейшей обработки и обучения

big
Исходный размер 1349x464

После происходит загрузка и предварительный просмотр изображений

Исходный размер 1093x372

С помощью модели BLIP генерируются описания к изображениям. Эти текстовые описания я буду использоваться как промпты при обучении генеративной модели

Исходный размер 1466x202
Исходный размер 678x451

На следующем этапе происходит обучение генеративной модели на собранном наборе изображений

Исходный размер 2144x258

Хорошо получился пейзаж, отображается стилистика мультфильма, особенности рисовки. Произошла небольшая проблема с домами героев, возможно нейросеть смешала несколько домов в один единый

Получились интересные персонажи, очень хорошо получился заяц Крош. Возникла проблема с цветами, так как они намешаны и появилось много зайцев

Пейзаж отличный, очень похоже на сцену из мультика, особенно валяющиеся предметы, будто герои просто вышли из кадра

Вышла интересная композиция с несколькими персонажами, которые в процессе генерирования смешались, но картинка выглядит ярко, похоже на сцену во время заставок песен в Смешариках

Большое количество звездочек в оттенках любимых персонажей вышли потрясающе. Есть отличительные символы мультфильма и сохранилась рисовка

Узнаваемость пространства осталась, но осталась проблема в смешении животных и цвета, но нейросеть старалась

Исходный размер 2144x258
0

Здесь представлена серия неудачных сгенерированных изображений. В основном ошибки возникали в анатомии персонажей, излишней детализации пространства, из-за чего общий рисунок полностью терялся, а также потеря форм и цвета

Исходный размер 848x202
Обучение генеративной модели Stable Diffusion под стиль смешариков
Проект создан 10.04.2025
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше