
Целью проекта было создание LoRA модели для генерации изображений, стилизованных под старые советские фотографии. Основная идея заключалась в том, чтобы современные сцены и объекты приобретали вид, характерный для советской эпохи, с присущей ей эстетикой, колоритом и артефактами. Проект стремился не просто создать фильтр «под старину», а именно передать атмосферу и визуальные особенности фотографий советского периода.

• Черно-белые фотографии: Групповые портреты рабочих и колхозников, сцены с демонстраций и парадов, моменты из повседневной жизни (например, дети играют во дворе, люди в очереди в магазине). Акцент на портреты, где хорошо видны детали лиц, одежда, окружение. Важно присутствие типичной советской атрибутики (флаги, транспаранты, памятники). • Фотографии в сепии: Семейные фотографии, пейзажи с советской архитектурой (многоэтажные дома, заводы, сельские виды). Сепии тон помогает передать эффект выцветания и старения. • Ранние цветные фотографии: Пейзажи с ярко-красными флагами и транспарантами, сцены празднования, портреты в национальной одежде. Особенность ранних цветных фото — приглушенные, немного выцветшие цвета и характерная зернистость.

Серия изображений
Результирующая серия изображений представляет собой впечатляющую стилизацию под старые советские фотографии, мастерски передающую атмосферу и визуальные особенности эпохи. Разнообразие цветовых гамм, от монохромной черно-белой классики до выцветшей сепии и приглушенных ранних цветных снимков, демонстрирует способность модели адаптироваться к различным исходным стилям. Особую реалистичность добавляют такие артефакты, как обрезанные края, трещины и помятости, имитирующие повреждения старых сканированных фотографий и придающие им аутентичный вид. Модель успешно генерирует изображения с узнаваемыми элементами советской архитектуры, автомобилей и предметов быта и одежды, обогащая каждую сцену историческим контекстом.
Разумеется, при генерации изображений людей возникали некоторые неточности и деформации, что является распространенной проблемой при работе с нейросетями. Однако, за счет экспериментирования с разнообразными промптами и их комбинациями, удалось минимизировать эти артефакты и добиться более реалистичного и узнаваемого представления человеческих лиц и фигур.
В целом, результат превзошел первоначальные ожидания, демонстрируя не только техническую способность к стилизации, но и художественную чувствительность к передаче духа советской эпохи. Серия изображений представляет собой интересный взгляд на прошлое сквозь призму современных технологий, позволяя визуализировать сцены и события в стилистике, характерной для старых советских фотографий. Признаться, я не ожидала столь точного попадания в цветовую гамму: от приглушенных оттенков ранних цветных снимков до теплой сепии и выразительной черно-белой палитры. То, как нейросеть уловила нюансы каждого периода, стало приятным сюрпризом.
Для обучения использовался Colab Notebook на Python с библиотеками для диффузионных моделей, трансформации и ускорения вычислений. Ноутбук был создан на основе открытых примеров для обучения LoRA, но адаптирован под задачу стилизации фотографий.
Процесс обучения:
1. Настройка окружения: Установлены библиотеки и подключен GPU. 2. Загрузка данных: Изображения загружены в Colab. 3. Определение промптов: Заданы instance и class prompts для стиля.
4. Настройка модели: Выбрана базовая диффузионная модель и настроены параметры LoRA, влияющие на качество и скорость обучения. 5. Обучение LoRA: Запущен процесс обучения, включающий подготовку данных, итерацию по данным, вычисление потерь и обновление весов LoRA.
6. Оценка результатов: Оценено качество LoRA путем генерации изображений и сравнения с исходным стилем. 7. Сохранение LoRA: Веса сохранены для дальнейшего использования.
«Описание применения генеративной модели»
В данном проекте, помимо обученной нейросети для создания изображений, использовались следующие инструменты:
• Colab Notebook из открытого репозитория: Ноутбук послужил основой для обучения LoRA. Он был адаптирован и настроен для конкретных задач проекта. • ChatGPT: Использовался для генерации промптов, а также для помощи в написании текста для данного развернутого описания проекта (лонгрида). Ссылка: @gpt3_unlim_chatbot