Идея проекта



Мне было интересно обучить LoRA на рисунках А. С. Пушкина, чтобы нейросеть умела рисовать в стиле его скетчей

Обычно люди стараются обучить нейросеть генерировать изображения в максимально реалистичном и детализированном стиле.
Мне, наоборот, хотелось передать этот простой лайновый монохромный стиль, сохранить в нем небрежность, но главное оставить его узнаваемым


Для генерации использовалась базовая SDXL‑модель с подключёнными обученными LoRA‑весами.
Исходные изображения были в плохом качестве, поэтому перед созданием датасета я увеличила разрешение каждой картинки в Topaz Gigapixel AI.
Результаты


Я сгенерировала несколько разнообразных сцен в пушкинском стиле
Изначально задача состояла в том, чтобы получить новые «пушкинские наброски» на любые сюжеты, выдержанные в духе его графики.
Главное, что хотелось сохранить от исходного стиля, — это небрежность линий, легкая деформация пропорций, отсутствие фона (фокус на персонажах) и минимум деталей
В итоговых генерациях в портретах больше внимания к персонажу и характеру линии, фон практически отсутствует. Линии небрежные, пропорции искажены
На большинстве изображений можно заметить очертания букв вокруг персонажей. Это тоже можно назвать частью стиля скетчей Пушкина, так как он рисовал их на тех же листах, на которых писал


Главная проблема, которая бросается в глаза — это отличия по цвету фона. В датасете все изображения были на белом или бледно бежевом фоне, а сгенерированные результаты получились более желтыми.
Я вычитала, что это связано с особенностями SDXL и style-LoRA. Думаю, это не критично, так как картинка по сути монохромная, и ее теплоту и яркость можно легко поправить в редакторе фотографий, если потребуется
Промпт: «ink sketch in PUSHKIN style, a man sitting at a desk writing with a feather pen»
Еще одна проблема, а возможно и преимущество: стиль не предполагает рисования окружения.
С одной стороны это ограничивает, например рисунок человека за письменным столом совсем не удался, однако, с другой стороны, это ограничение оставляет генерацию в понятных рамках стиля. Человек за столом, скорее всего, выглядел бы как обычный скетч, в нем бы не прослеживался стиль Пушкина, так как он в своей сути другой
Код
Я собрала корпус из 36 квадратных пушкинских рисунков форматом 1:1 и обучила на нём LoRA поверх базовой SDXL‑модели
В качестве текстового маркера я выбрала искусственный токен стиля «ink sketch in PUSHKIN style», он позволяет отделить общий смысл промпта (сюжет, персонажи, композицию) от общего стиля
Использование ИИ
Я использовала генеративный ИИ (Perplexity, powered by GPT‑5.4) как технического консультанта. Для помощи в разборе ошибок кода и объяснения непонятных моментов
Для улучшения качества исходных изображений использовалась Topaz Gigapixel AI.
Perplexity: https://www.perplexity.ai Topaz Gigapixel AI: https://www.topazlabs.com/topaz-gigapixel




