Original size 2239x3160

SOVIET FUTURISM

7

I. Идея проекта

В основе данного проекта — интерес к визуальной эстетике советского футуризма и желание исследовать то, как эта стилистика могла бы выглядеть, если бы продолжила развиваться сегодня. Советский футуризм — это не только про прошлое, но и про масштабные идеи будущего: космические амбиции, уверенность в технологическом прогрессе, геометрическую строгость и рациональный оптимизм.

Вместо личных снимков я работаю с открытым визуальным материалом — архивами, архитектурными проектами и графическими элементами, которые отражают эту эстетическую логику. Задача заключается в том, чтобы обучить генеративную модель не просто копировать эти изображения, а понять визуальные принципы и научиться применять их к новым сюжетам.

II. Подготовка окружения

Начинаю работу с настройки технической среды — загружаю необходимые необходимые инструменты и инструкции для работы.

big
Original size 3283x1216

Проверяем подключение к GPU

big
Original size 3283x205

Ускорение вычислений

big
Original size 3283x468

Загружаем репозиторий Diffusers

big
Original size 3283x882

Скачиваем скрипт для дообучения

Сначала я выполняю проверку GPU для оценки аппаратной готовности системы. Затем устанавливаю все необходимые программные компоненты: основную библиотеку для ИИ-моделей и специализированный фреймворк, обеспечивающий адаптацию больших моделей под конкретные задачи с минимальными затратами ресурсов. Далее подключается актуальная версия библиотеки для диффузионных моделей — моего основного инструмента для генерации изображений. В завершение использую скрипт для обучения по методу Dreambooth с технологией LoRA, который служит подробной инструкцией для «встраивания» моего уникального визуального стиля в готовую модель.

III. Подготовка датасета

Здесь я загружаю подборку изображений, которые будут основой для обучения модели стилю советского футуризма.

Original size 3283x729

Загружаем изображения для дообучения в local_dir

0

Фотографии были найдены в Wikimedia с фильтром «No restrictions»

Original size 3771x1185

Датасет включает 14 изображений, которые отражают ключевые визуальные признаки советского футуризма: строгую геометрию, промышленную эстетику, архитектурные формы и приглушённую палитру.

IV. Генерация подписей к изображениям

Original size 3283x729

Просматриваем загруженные изображения для проверки качества и содержания

Original size 3283x495

Создаем пути и открываем изображения

Original size 3283x905

Выбираем GPU для проведения вычислений

Original size 3283x590

Создаем файл метаданных для обучения

Original size 3560x2078

Вывод полученных описаний изображений

Original size 3283x398

Избавляемся от модели BLIP, чтобы освободить память

На этом этапе код с помощью модели компьютерного зрения BLIP автоматически создает описания для каждого изображения, добавляя к ним стилевой маркер «photo in my style». Все полученные пары «файл-описание» сохраняются в metadata.jsonl для обучения нейросети, после чего BLIP выгружается для экономии GPU ресурсов.

V. Подготовка окружения к обучению

Original size 3283x359

Выставляем настройки

Original size 3283x263

Авторизуемся на Hugging Face

Теперь нужно получить токен от Hugging Face для обучения нейросети, а затем добавить его в среду кодирования.

VI. Обучение модели

Original size 2193x1418

Проверяем сохраненные веса модели после обучения

VII. Сохранение на Hugging Face

Original size 2382x1826

VIII. Генерация изображений

Original size 2382x1013

Демонстрируем работу модели с объединенными весами LoRA

Автоматически определяя мое имя пользователя Hugging Face, код создает новый репозиторий модели, генерирует информационную карточку с метаданными обучения и загружает туда все файлы обученного LoRA-адаптера.

IX. Результирующая серия изображений

Original size 1024x1024

prompt = «a futuristic city in the style of Soviet Futurism»

Original size 1024x1024

prompt = «a building in the style of Soviet Futurism»

Original size 1024x1024

prompt = «a bridge in the style of Soviet Futurism»

Original size 1024x1024

prompt = «a university in the style of Soviet Futurism»

Original size 0x0

prompt = «a robot in the style of Soviet Futurism»

Original size 0x0

prompt = «a space station in the style of Soviet Futurism»

Модель успешно научилась применять стиль «советский футуризм» к разнообразным сюжетам. Наиболее ярко стиль проявился в архитектурных сценах, где модель комбинировала современные городские пейзажи с характерными советскими архитектурными элементами.

XI. Описание применения генеративной модели

Обученная генеративная нейросеть смогла в общих чертах воссоздать визуальный стиль моего пленочного архива, отразив его узнаваемый цвет и композицию кадра. Главной проблемой стало автоматическое создание подписей: модель BLIP, без последующей обработки в Chat GPT генерирует описания, лишенные деталей и специфики.

XII. Результаты обучения

В результате обучения удалось добиться устойчивого и узнаваемого визуального языка, который аккуратно наследует ключевые признаки советского футуризма. Модель корректно воспроизводит геометрию, композицию и характерную палитру, уверенно работает с архитектурой и инфраструктурными сюжетами, а также предлагает убедительные новые вариации на тему утопического инженерного будущего.

Несмотря на небольшой обучающий набор, переноса стиля оказалось достаточно для формирования цельной визуальной логики, позволяющей модели уверенно применять эстетику на новых сюжетах — как на близких оригиналу, так и на более экспериментальных. Иногда модель проявляет избыточную склонность к приглушённой палитре и «полиграфической» текстуре, однако это расценивается скорее как часть общей стилистической инерции, чем как ошибка. В целом проект демонстрирует, что ограниченный архив визуального материала уже способен служить основой для обучения генеративной модели, которая продолжает и развивает эстетику выбранного периода.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more