gogen style LoRA на Geograffee

Поль Гоген — один из самых ярких постимпрессионистов, чей стиль строится на синтетизме, плоскостности, декоративности и насыщенном цвете.

Меня всегда привлекало, как он отказывался от натуралистичной перспективы в пользу выразительных цветовых пятен и обобщённых форм.

Я решила создать LoRA-модель, которая переняла бы эти ключевые визуальные черты и позволила генерировать новые сюжеты, уже не принадлежащие кисти художника, но выполненные в его узнаваемой манере.

Для обучения было отобрано 30 изображений — характерных работ Гогена из разных периодов: таитянские циклы, бретонские сцены, портреты и натюрморты.

Исходный размер 3606x2150

Все изображения взяты с сайта Артхив. Поскольку Поль Гоген умер в 1903 году, его произведения уже перешли в общественное достояние, что делает их использование для обучения нейросети этически и юридически корректным.

P. S. также я обращала внимание на отношение картин к частным коллекциям или частным выставкам, и взяла только картины относящиеся к национальным галлереям

P. P. S. не требующие покупки цифровой версии для использования

Исходный размер 3606x2149

Обучение проводилось в Google Colab по методу LoRA на базе Stable Diffusion XL 1.0.

В качестве уникального токена стиля использовалось словосочетание gogen style, а для каждого изображения создавалось текстовое описание, включающее этот токен и краткий сюжет (например: «a painting in gogen style, a painting of a road with trees and a church in the background»).

Результаты

prompts: <…> fantasy landscape, vibrant colors, detailed <…> portrait of a warrior, detailed armor <…> ethereal elf princess in forest, soft lighting <…> street art mural with bold colors <…> magical forest with glowing mushrooms <…> steampunk airship in the sky <…> cosmic deity with stars <…> tarot card illustration, the sun, ornate frame

Исходный размер 4216x2088

Итоговая LoRA-модель успешно переняла основные черты стиля Гогена:

- плоскостную композицию - обобщённые, почти силуэтные формы - декоративность и орнаментальность - характерное для художника тяготение к тёплым, «земляным» оттенкам

Полученная модель может служить инструментом для экспериментов с «гогеновской» эстетикой в новых сюжетах — от современных портретов до фантастических ландшафтов.

Основные ограничения связаны с потерями детализации при низком разрешении обучения и цветовыми искажениями, которые можно частично компенсировать более разнообразным датасетом или постобработкой.

Материалы, модель LoRA, сгенерированные мною картинки и ноутбук

В рамках проекта были применены следующие генеративные и вспомогательные нейросетевые модели:

BLIP (Bootstrapping Language-Image Pre-training) — использовался на этапе подготовки датасета для автоматической генерации текстовых описаний (подписей) к исходным изображениям. Модель загружалась из репозитория Salesforce/blip-image-captioning-base и применялась к каждому изображению. Это позволило создать файл metadata.jsonl, необходимый для обучения LoRA-модели.

DeepSeek — применялась на этапе подготовки текстового сопровождения проекта, генерация идей для промптов, написание и структурирование текста экспликации, уточнение технических деталей описания процесса обучения и анализа результатов.

Stable Diffusion XL + DreamBooth LoRA — основная обученная генеративная модель, созданная в рамках проекта. После дообучения на собранном датасете она использовалась для генерации итоговой серии изображений в заданном стиле.