Исходный размер 1140x1600

Обучение нейросети в стиле Андре Кертеша

Финалист конкурса

Концепция

big
Исходный размер 1024x427

Проект посвящен обучению нейросети генерировать изображения в стиле фотохудожника Андре Кертеша, одного из величайших мастеров мировой фотографии XX  века. Кертеш, используя зеркала и различные оптические искажения, создавал текучие, сюриалистичные, изменённые формы, которые вбирали в себя тот факт, что реальность субъективна. Я заметила, что при генерации изображений с помощью ИИ мы часто сталкиваемся с теми же искажениями: дополнительные пальцы, сливающиеся руки и ноги, размытые или неполные объекты. Эти визуальные ошибки отражают сам процесс восприятия реальности — что-то знакомое, но и в то же время чуждое. Я решила использовать эти особенности ИИ для воссоздания видения Кертеша, обучив нейросеть генерировать работы, которые приближены к его стилю.

Изображения для обучения модели

Работы Кертеша можно разделить на несколько ключевых тем: портреты, интерьерные сцены, натюрморты из повседневности. В процессе я опиралась на данные жанры для генерации изображений, которые отражают его уникальную способность передавать мир через рассеянный, искажённый взгляд, приобретая сюрреалистичный и даже ужасающий характер.

0

Итоговые сгенерированные работы

Сравнивая оригинальные работы Кертеша с сгенерированными, видно, что особенно удачно удалось воссоздать искажения фигур через зеркала, а также повседневные натюрморты и портреты. Именно в этих фрагментах наиболее ярко раскрываются ключевые черты стиля Кертеша: размытость формы, нереальность происходящего, расплывчатость образов, игра света и тени, контрастность, зернистость, а также устрашающая эстетика, свойственная его творчеству. В изображениях ярко проявляются сильные искажения пропорций и эффект калейдоскопа, что создает особое ощущение мира Кертеша, где реальность теряет свою строгую логику и поддается преобразованиям.

Особенно красиво выглядят изображения стеклянных предметов. Иногда можно заметить несоответствие масштаба объектов, или вдруг появляются дополнительные элементы — например, ноги, которые вовсе не должны быть частью композиции. Такие искажения реальности, несмотря на свою необычность, идеально вписываются в сюрреалистичный дух художника и соответствуют концепции.

Портреты

Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024

Люди в среде

Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024

Повседневность и объекты

Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024

Процесс обучения

Для создания изображений в стиле Андре Кертеша был использован подход дообучения модели Stable Diffusion v1.5  с применением метода LoRA. Обучение проводилось в Google Colab с использованием GPU-ускорения. Процесс включал отбор 19  наиболее репрезентативных работ для датасета, отражающих стиль и жанры Кертеша, настройку тренировочного пайплайна с применением LoRA к слоям UNet и текстового энкодера, а также сохранение обученных весов. Обучение длилось 500  шагов, с промежуточной проверкой на 250-м шаге. Результатом стала модель kertesz_style_LoRA, с помощью которой была сгенерирована итоговая серия изображений.

В проекте также использовался ChatGPT  — на этапе написания и проверки кода, а также для генерации и доработки части сюжетов текстовых промптов.

Обучение нейросети в стиле Андре Кертеша
Проект создан 10.04.2025
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше