Свет, которого нет: стиль Куинджи через LoRA на Geograffee

Исходный размер 1920x940

Куинджи, Архип Иванович «Вечер на Украине» 1878 год

КОНЦЕПЦИЯ

Архип Куинджи — художник, которого невозможно спутать ни с кем. Его фирменный приём — свет, вырывающийся из тьмы. Лунная дорожка на Днепре, золотистые отсветы на траве, почти мистическое свечение там, где его быть не должно.

Стандартные нейросети этот приём не понимают. Они умеют рисовать «ночь» и «луну», но не умеют передавать тот самый куинджиевский контраст — когда свет не просто присутствует, а является главным действующим лицом.

Задача проекта: дообучить Stable Diffusion XL на небольшой коллекции работ Куинджи, чтобы модель научилась не просто копировать композиции, а чувствовать его манеру работы со светом.

ДАТАСЕТ

Исходный размер 1280x256

Коллаж картин Куинджи Архипа Ивановича.

Для обучения использовалось всего 16 изображений — сознательное решение.

LoRA хороша тем, что позволяет передать стиль на малом объёме данных, избегая переобучения под конкретные сюжеты.

Исходный размер 1626x1002

Все промпты начинаются с фразы «in the style of kuindzhi». Это якорь, который привязывает стиль к конкретному запросу.

Исходный размер 2048x900

Каждое изображение получило текстовое описание в формате JSONL.

ОБУЧЕНИЕ

Вместо полного дообучения всей модели (что потребовало бы огромных ресурсов) использовался метод LoRA — Low-Rank Adaptation. Он добавляет к базовой сети небольшой набор дополнительных весов, которые обучаются под конкретную задачу. Результат: модель весом в несколько гигабайт дополняется адаптером всего на десятки мегабайт.

Исходный размер 1762x1368

Параметры обучения.

Базовая модель: stabilityai/stable-diffusion-xl-base-1.0

VAE: madebyollin/sdxl-vae-fp16-fix — помогает избежать артефактов и экономит память

Разрешение: 768 пикселей

Шагов обучения: 500

Скорость обучения: 1e-4

Batch size: 1 с накоплением градиентов — позволило обойтись без мощного сервера

Обучение заняло часа на доступной видеокарте от Google Colab. Это один из главных плюсов LoRA: экспериментировать со стилями можно быстро и без дата-центров.

ГЕНЕРАЦИЯ

После обучения достаточно загрузить LoRA-адаптер и отправить запрос:

Исходный размер 1474x666

Фраза «in the style of kuindzhi» остаётся обязательной — это ключ, который активирует обученные веса. Всё остальное — поле для творчества.

Исходный размер 1024x1024

prompt: «in the style of kuindzhi, night»

Исходный размер 1024x1024

prompt: «in the style of kuindzhi, night and animals»

Исходный размер 1024x1024

prompt: «in the style of kuindzhi, a man walks through the thicket of the forest»

Исходный размер 1024x1024

prompt: «in the style of kuindzhi, day»

Исходный размер 1024x1024

prompt: «in the style of kuindzhi, forest with morning light»

Исходный размер 1024x1024

prompt: «in the style of kuindzhi, night and animals»

Исходный размер 1024x1024

prompt: «in the style of kuindzhi, rainbow»

ИТОГИ

Проект показал, что даже на нескольких изображениях можно обучить модель чувствовать сложный художественный стиль. LoRA оказалась идеальным инструментом для таких задач: быстро, дёшево, с предсказуемым результатом.

Полученный адаптер весит считанные мегабайты, его можно использовать в связке с другими LoRA, выкладывать на Hugging Face или применять в собственных генерациях.

Главное же — нейросеть наконец-то научилась видеть свет так, как это делал Куинджи. Ну, или хотя бы приблизилась к этому.

ССЫЛКИ

Датасет с картинами Куинджи

Блокнот с кодом

Обученная модель

Лучший помощник, ассистент, учитель и выявитель ошибок

Красивый код