Original size 1140x1600

Обучение модели на старых советских фото

Целью проекта было создание LoRA модели для генерации изображений, стилизованных под старые советские фотографии. Основная идея заключалась в том, чтобы современные сцены и объекты приобретали вид, характерный для советской эпохи, с присущей ей эстетикой, колоритом и артефактами. Проект стремился не просто создать фильтр «под старину», а именно передать атмосферу и визуальные особенности фотографий советского периода.

Original size 963x614

• Черно-белые фотографии: Групповые портреты рабочих и колхозников, сцены с демонстраций и парадов, моменты из повседневной жизни (например, дети играют во дворе, люди в очереди в магазине). Акцент на портреты, где хорошо видны детали лиц, одежда, окружение. Важно присутствие типичной советской атрибутики (флаги, транспаранты, памятники). • Фотографии в сепии: Семейные фотографии, пейзажи с советской архитектурой (многоэтажные дома, заводы, сельские виды). Сепии тон помогает передать эффект выцветания и старения. • Ранние цветные фотографии: Пейзажи с ярко-красными флагами и транспарантами, сцены празднования, портреты в национальной одежде. Особенность ранних цветных фото — приглушенные, немного выцветшие цвета и характерная зернистость.

Original size 1127x792

Серия изображений

Original size 1598x1024

Слева — генерация, справа — исходное фото

Результирующая серия изображений представляет собой впечатляющую стилизацию под старые советские фотографии, мастерски передающую атмосферу и визуальные особенности эпохи. Разнообразие цветовых гамм, от монохромной черно-белой классики до выцветшей сепии и приглушенных ранних цветных снимков, демонстрирует способность модели адаптироваться к различным исходным стилям. Особую реалистичность добавляют такие артефакты, как обрезанные края, трещины и помятости, имитирующие повреждения старых сканированных фотографий и придающие им аутентичный вид. Модель успешно генерирует изображения с узнаваемыми элементами советской архитектуры, автомобилей и предметов быта и одежды, обогащая каждую сцену историческим контекстом.

Original size 1404x448

Original size 1024x1024

Разумеется, при генерации изображений людей возникали некоторые неточности и деформации, что является распространенной проблемой при работе с нейросетями. Однако, за счет экспериментирования с разнообразными промптами и их комбинациями, удалось минимизировать эти артефакты и добиться более реалистичного и узнаваемого представления человеческих лиц и фигур.

Original size 924x448

Original size 1404x448

Original size 1024x1024

В целом, результат превзошел первоначальные ожидания, демонстрируя не только техническую способность к стилизации, но и художественную чувствительность к передаче духа советской эпохи. Серия изображений представляет собой интересный взгляд на прошлое сквозь призму современных технологий, позволяя визуализировать сцены и события в стилистике, характерной для старых советских фотографий. Признаться, я не ожидала столь точного попадания в цветовую гамму: от приглушенных оттенков ранних цветных снимков до теплой сепии и выразительной черно-белой палитры. То, как нейросеть уловила нюансы каждого периода, стало приятным сюрпризом.

Original size 926x448

Original size 1605x1024

Original size 1598x1024

Original size 1024x904

Блокнот с кодом

Для обучения использовался Colab Notebook на Python с библиотеками для диффузионных моделей, трансформации и ускорения вычислений. Ноутбук был создан на основе открытых примеров для обучения LoRA, но адаптирован под задачу стилизации фотографий.

Процесс обучения:

1. Настройка окружения: Установлены библиотеки и подключен GPU. 2. Загрузка данных: Изображения загружены в Colab. 3. Определение промптов: Заданы instance и class prompts для стиля.

Original size 918x183

Новый промпт

4. Настройка модели: Выбрана базовая диффузионная модель и настроены параметры LoRA, влияющие на качество и скорость обучения. 5. Обучение LoRA: Запущен процесс обучения, включающий подготовку данных, итерацию по данным, вычисление потерь и обновление весов LoRA.

Original size 1852x432

Настройки и параметры тренировки модели

6. Оценка результатов: Оценено качество LoRA путем генерации изображений и сравнения с исходным стилем. 7. Сохранение LoRA: Веса сохранены для дальнейшего использования.

Original size 1426x366

Генерация

«Описание применения генеративной модели»

В данном проекте, помимо обученной нейросети для создания изображений, использовались следующие инструменты:

• Colab Notebook из открытого репозитория: Ноутбук послужил основой для обучения LoRA. Он был адаптирован и настроен для конкретных задач проекта. • ChatGPT: Использовался для генерации промптов, а также для помощи в написании текста для данного развернутого описания проекта (лонгрида). Ссылка: @gpt3_unlim_chatbot

Обучение модели на старых советских фото

Almira Volodkina

artificial intelligence

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...