
I. Идея проекта
В основе данного проекта — интерес к визуальной эстетике советского футуризма и желание исследовать то, как эта стилистика могла бы выглядеть, если бы продолжила развиваться сегодня. Советский футуризм — это не только про прошлое, но и про масштабные идеи будущего: космические амбиции, уверенность в технологическом прогрессе, геометрическую строгость и рациональный оптимизм.
Вместо личных снимков я работаю с открытым визуальным материалом — архивами, архитектурными проектами и графическими элементами, которые отражают эту эстетическую логику. Задача заключается в том, чтобы обучить генеративную модель не просто копировать эти изображения, а понять визуальные принципы и научиться применять их к новым сюжетам.
II. Подготовка окружения
Начинаю работу с настройки технической среды — загружаю необходимые необходимые инструменты и инструкции для работы.




Сначала я выполняю проверку GPU для оценки аппаратной готовности системы. Затем устанавливаю все необходимые программные компоненты: основную библиотеку для ИИ-моделей и специализированный фреймворк, обеспечивающий адаптацию больших моделей под конкретные задачи с минимальными затратами ресурсов. Далее подключается актуальная версия библиотеки для диффузионных моделей — моего основного инструмента для генерации изображений. В завершение использую скрипт для обучения по методу Dreambooth с технологией LoRA, который служит подробной инструкцией для «встраивания» моего уникального визуального стиля в готовую модель.
III. Подготовка датасета
Здесь я загружаю подборку изображений, которые будут основой для обучения модели стилю советского футуризма.
Датасет включает 14 изображений, которые отражают ключевые визуальные признаки советского футуризма: строгую геометрию, промышленную эстетику, архитектурные формы и приглушённую палитру.
IV. Генерация подписей к изображениям
На этом этапе код с помощью модели компьютерного зрения BLIP автоматически создает описания для каждого изображения, добавляя к ним стилевой маркер «photo in my style». Все полученные пары «файл-описание» сохраняются в metadata.jsonl для обучения нейросети, после чего BLIP выгружается для экономии GPU ресурсов.
V. Подготовка окружения к обучению
Теперь нужно получить токен от Hugging Face для обучения нейросети, а затем добавить его в среду кодирования.
VI. Обучение модели
VII. Сохранение на Hugging Face
VIII. Генерация изображений
Автоматически определяя мое имя пользователя Hugging Face, код создает новый репозиторий модели, генерирует информационную карточку с метаданными обучения и загружает туда все файлы обученного LoRA-адаптера.
IX. Результирующая серия изображений
Модель успешно научилась применять стиль «советский футуризм» к разнообразным сюжетам. Наиболее ярко стиль проявился в архитектурных сценах, где модель комбинировала современные городские пейзажи с характерными советскими архитектурными элементами.
XI. Описание применения генеративной модели
Обученная генеративная нейросеть смогла в общих чертах воссоздать визуальный стиль моего пленочного архива, отразив его узнаваемый цвет и композицию кадра. Главной проблемой стало автоматическое создание подписей: модель BLIP, без последующей обработки в Chat GPT генерирует описания, лишенные деталей и специфики.
XII. Результаты обучения
В результате обучения удалось добиться устойчивого и узнаваемого визуального языка, который аккуратно наследует ключевые признаки советского футуризма. Модель корректно воспроизводит геометрию, композицию и характерную палитру, уверенно работает с архитектурой и инфраструктурными сюжетами, а также предлагает убедительные новые вариации на тему утопического инженерного будущего.
Несмотря на небольшой обучающий набор, переноса стиля оказалось достаточно для формирования цельной визуальной логики, позволяющей модели уверенно применять эстетику на новых сюжетах — как на близких оригиналу, так и на более экспериментальных. Иногда модель проявляет избыточную склонность к приглушённой палитре и «полиграфической» текстуре, однако это расценивается скорее как часть общей стилистической инерции, чем как ошибка. В целом проект демонстрирует, что ограниченный архив визуального материала уже способен служить основой для обучения генеративной модели, которая продолжает и развивает эстетику выбранного периода.