кубизм на Geograffee

Описание идеи

Проект посвящен исследованию возможностей генеративных нейросетей в воспроизведении художественного стиля, близкого к раннему кубизму, на примере пейзажной живописи Поля Сезанна. Основная идея — обучить модель Stable Diffusion распознавать характерные визуальные особенности живописи кубизма и затем использовать ее для генерации новых, ранее не существовавших пейзажей в этом стиле.

Исходный размер 1024x1024

Результирующая серия изображений

Исходный размер 768x768

Развернутый комментарий

Сгенерированные изображения демонстрируют воспроизведение ключевых признаков стиля. Во всех изображениях объекты разбиты на простые геометрические плоскости — горы представлены как набор граней, деревья и здания упрощены до объемных блоков, пространство строится через пересечение форм. Это соответствует принципам кубизма. Модель корректно воспроизводит характерную палитру — сочетание зеленых, охристых и голубых оттенков, мягкие переходы между цветами, отсутствие фотореалистичной резкости. Цвет используется не как отражение реальности, а как средство построения формы. В изображениях прослеживаются — многоплановость, смещение перспективы, уплощение пространства. Особенно это заметно в пейзажах с домами и горами, где глубина создается не через перспективу, а через цвет и форму. Несмотря на единый стиль, изображения отличаются — композицией, плотностью геометрических форм, насыщенностью цвета. Это говорит о том, что модель не просто копирует обучающие изображения, а создает новые комбинации элементов. В результате проекта удалось показать, что даже на небольшом датасете нейросеть способна воспроизводить сложные художественные стили. Для обучения использовалась модель Stable Diffusion XL (SDXL) с методом DreamBooth + LoRA.

Ссылки на код и исходники изображений

Код

Исходники

Использование ИИ

В рамках проекта, помимо обученной модели Stable Diffusion XL с использованием DreamBooth и LoRA, также применялись инструменты генеративного искусственного интеллекта для вспомогательных задач. Был использован ChatGPT для: генерации и уточнения текстовых описаний проекта (экспликации); формулировки промптов для генерации изображений; помощи в настройке кода и устранении технических ошибок при обучении модели; структурирования и оформления итогового материала.

Использование изображений

В качестве датасета были использованы изображения Поля Сезанна, полученные с платформы WikiArt. Произведения художника находятся в общественном достоянии (public domain), поскольку срок действия авторских прав истёк. Использование изображений осуществлялось исключительно в учебных и исследовательских целях, без коммерческого распространения.