Органический сюрреализм: обучение нейросети авторскому языку на Geograffee

описание идеи всего проекта

Проект посвящён исследованию возможности переноса авторского графического стиля в генеративную нейросеть.

В своих иллюстрациях я работаю с темами: — трансформации тела — гибридности (человек / животное / объект) — органических и псевдо-анатомических структур — тревожной, сюрреалистической эстетики

Цель проекта — обучить модель Stable Diffusion воспроизводить не просто визуальные элементы (штриховку, композицию), а сам принцип формирования образа: соединение несовместимых форм в единую систему.

исходные изображения для обучения

Для обучения был собран датасет из 13 изображений — это авторские иллюстрации, выполненные в едином графическом стиле.

Характеристики датасета: формат: квадрат (1:1) техника: черно-белая графика визуальные особенности: — точечная штриховка (stippling) — контурная линия разной толщины — высокая детализация — органические текстуры сюжетные особенности: — гибридные существа — деформированные тела — сочетание живого и неживого — замкнутые композиции

Важно: датасет не содержит чужих изображений — только авторские работы, что делает обучение корректным с точки зрения авторства.

результирующая серия изображений

комментарий

Итоговая серия представляет собой вариации гибридных существ, сгенерированных на основе авторского графического стиля. Изображения не повторяют исходные работы, а переосмысляют их, сохраняя принципы построения формы и композиции.

Серия продолжает исследование темы трансформации тела и гибридности. Образы находятся между человеком, животным и объектом, отражая идею нестабильности формы и размытых границ между категориями.

Что удалось передать: — характерную точечную штриховку — плотность и насыщенность композиции — биоморфные формы — принцип гибридизации (слияние объектов и тел)

Частично удалось: — анатомическую логику (иногда формы становятся слишком абстрактными) — контроль пропорций

Не всегда стабильно: — мелкие детали (иногда «расплываются») — повторяемость конкретных мотивов

Для генерации использовались текстовые промпты, описывающие стиль и содержание.

Сгенерированные изображения отличаются: — степенью «органичности» (от почти анатомических до полностью абстрактных) — плотностью деталей — балансом пустого и заполненного пространства — уровнем «тревожности» образа

Интересный эффект: нейросеть не копирует конкретные изображения, а пересобирает язык формы, создавая новые комбинации элементов.

Вывод: Серия демонстрирует, что нейросеть способна воспроизводить не только внешний вид, но и принципы авторского стиля, создавая новые визуальные интерпретации.

код

В процессе работы над проектом я протестировала два аналитических подхода к обучению нейросети, чтобы добиться максимального соответствия моему визуальному стилю.

Сначала я использовала официальный пайплайн для Fine-tuning SDXL. Этот метод хорош тем, что содержит в себе автоматизированные скрипты для визуализации датасета и подготовки среды «в один клик». Однако в процессе я столкнулась с избыточностью кода и сложностью тонкой настройки под специфическую графику.

ссылка на колаб. 1 способ

Затем я решила собрать собственный алгоритм обучения на базе библиотек diffusers и accelerate.

Это позволило мне:

Оптимизировать память: Я внедрила использование 8-битного оптимизатора Adam и Gradient Checkpointing, что позволило запустить обучение SDXL на бесплатном GPU без ошибок.

Повысить контроль: Я вручную настроила параметры разрешения (512px) и темпа обучения (learning rate 1e-4), чтобы сохранить четкость штриховки в моих работах.

Гибкая генерация: Итоговый код позволил мне быстрее тестировать промпты на стыке сюрреализма и привычных объектов.

ссылка на колаб. 2 способ

заключение

Проект показывает, что генеративные модели способны: — усваивать не только визуальные признаки, но и структурные принципы стиля — создавать новые образы в рамках заданной эстетики — выступать как инструмент расширения авторского языка

При этом результат требует кураторской работы — отбора, настройки и интерпретации.

описание применения генеративной модели

В проекте использовались: ChatGPT — для формулировки текстов и помощи в анализе