Идея и цель проекта
Задача: обучить нейросеть воспроизводить уникальный стиль Альфонса Мухи (ар-нуво) для генерации новых изображений в этой эстетике
Актуальность: проверка способности ИИ усваивать сложные декоративные принципы (симметрия, орнамент, плоская графика) и переносить их на современные сюжеты
Нейросеть обучается на репрезентативной базе данных картин знаменитого художника, изучая композицию, цветовую палитру, технику мазка, особенности освещения и другие ключевые элементы, формирующие его уникальный художественный почерк.
исходные изображения для обучения
Художником, чьи работы стали основой данного проекта, является Альфонс Муха — гениальный чешский живописец, театральный художник и иллюстратор, чье имя стало практически синонимом стиля ар-нуво (модерн). Муха прославился на весь мир благодаря своим афишам для актрисы Сары Бернар и потрясающим коммерческим плакатам. Его стиль — это торжество идеализированной женской красоты, плавных линий (так называемый «удар бича»), пастельных тонов и невероятно сложных, математически выверенных цветочных орнаментов, сплетающихся в нимбы вокруг голов героинь.
исходные изображения для обучения
исходные изображения для обучения
Интерес к оцифровке стиля Альфонса Мухи с помощью нейросетей обусловлен тем, что этот стиль требует от искусственного интеллекта жесткой дисциплины. Генеративные модели склонны к хаосу и фотореализму, в то время как эстетика Мухи требует графичности: безупречной симметрии круговых рамок, строгой логики переплетения стилизованных волос (знаменитых «макаронин» Мухи) и плоской, литографической заливки цвета. Заставить ИИ следовать законам декоративно-прикладного искусства конца XIX века — сложнейшая и крайне увлекательная задача.
исходные изображения для обучения
Ниже представлены некоторые работы Альфонса Мухи, вошедшие в базу данных для обучения искусственного интеллекта.
Серия изображений
Процесс обучения нейросети для генерации изображений:
- Сбор и очистка базы изображений (картин художника, в данном случае).
- Выбор архитектуры нейросети (например, GAN, VAE).
- Обучение генератора и дискриминатора.
- Настройка параметров обучения (скорость обучения, функция потерь).
- Визуальная оценка качества полученных изображений, корректировка, если требуется.
Техническая реализация (Код и процесс обучения)
В рамках проекта обучение проводилось в облачной среде Google Colab. Ниже представлены ключевые фрагменты кода, использованные для настройки и запуска процесса файнтюнинга, а также их краткое описание.
Сначала мы устанавливаем нужные программы (библиотеки) в Google Colab. Они нужны, чтобы нейросеть могла работать с картинками и обучаться на них. Так как современные нейросети очень «тяжелые», мы используем специальные инструменты, которые сжимают процесс и позволяют запустить его даже на бесплатной видеокарте, не теряя при этом качества.
Это главная команда. Здесь мы буквально говорим нейросети: «Возьми базовую модель, посмотри наши картинки из папки датасета, запомни этот стиль по специальному кодовому слову и сделай нужное количество шагов тренировки». Чтобы облако не зависло от нехватки памяти, мы включаем экономный режим — смешанную точность и 8-битный оптимизатор. Это как упаковать большой чемодан вещей в маленькую ручную кладь.
Steps: 100% 250/250 [19:09<00:00, 4.60s/it, loss=0.297, lr=0.0001]Model weights saved in Muha_lora/pytorch_lora_weights.safetensors
Нейросеть шаг за шагом просматривает картинки и пытается уловить стиль Мухи. Мы используем метод LoRA — это такой «умный фильтр». Благодаря ему нейросеть не ломает свои базовые знания о мире (она всё ещё помнит, как выглядит девушка или цветок), а просто учится рисовать эти вещи в новом, декоративном стиле с характерными орнаментами.
Картины Альфонса Мухи отличаются ярким, узнаваемым стилем, который характеризуется несколькими ключевыми особенностями:
- Идеализированные женские образы в свободных, струящихся одеждах.
- Специфическая стилизация волос, которые ложатся густыми, переплетающимися прядями («макаронами»).
- Круговые нимбы и сложные декоративные рамки на заднем фоне, создающие эффект витража или иконы.
- Изобилие ботанических орнаментов (цветы, стебли, листья), органично вплетенных в композицию.
- Приглушенная, пастельная цветовая палитра, имитирующая винтажную технику цветной литографии.
Именно эти особенности делают работы Альфонса Мухи такими уникальными, запоминающимися и определяющими визуальный канон эпохи ар-нуво
Примеры сгенерированных изображений и промпты
Для тестирования модели и раскрытия её потенциала были составлены специальные промпты, проверяющие разные аспекты стиля, включая перенос на современные сюжеты:
Аллегория Весны: «A beautiful ethereal woman representing Spring, flowing blonde hair interwoven with blooming lilies and ivy, wearing a sheer draped pale green dress, in the style of mucha style, Art Nouveau poster, circular floral halo background, delicate linework, pastel colors.»
Аллегория Ночи: «An elegant woman personifying the Night sky, dark flowing hair, holding a glowing crescent moon, surrounded by stylized stars and poppy flowers, in the style of mucha style, decorative stained glass elements, rich indigo and gold palette, elegant typography borders.»
Театральная актриса: «A dramatic portrait of a theatrical actress in a lavish historical costume, holding a tragedy mask, intricate jewelry, in the style of mucha style, Alphonse Mucha lithograph, elaborate decorative frame, muted earth tones.»
Муза искусства: «A serene female muse holding a painter’s palette and brushes, swirling ribbons and fabric around her figure, in the style of mucha style, Art Nouveau illustration, symmetrical composition, floral motifs, clear outlines.»
Райская птица: «A majestic peacock with fully displayed tail feathers intertwined with blooming roses and thorny vines, in the style of mucha style, highly decorative Art Nouveau framing, flat pastel colors, precise ink outlines.»
Цветочная композиция: «A complex symmetrical arrangement of sunflowers, irises, and swirling botanical vines inside a circular golden frame, in the style of mucha style, decorative arts, Alphonse Mucha poster background elements.»
Винтажное украшение: «Macro close-up of an ornate Art Nouveau golden brooch featuring a woman’s profile and emerald gemstones, surrounded by stylized flowing hair motifs, in the style of mucha style, elegant commercial illustration, soft lighting.»
Знаки Зодиака: «A circular astrological calendar featuring the twelve zodiac signs intertwined with female figures and seasonal flowers, in the style of mucha style, complex lithographic details, vintage poster aesthetic.»
сгенерированные изображения
Киберпанк-богиня: «A female cyborg with mechanical joints and glowing neon wires, but posed elegantly like an Art Nouveau goddess, surrounded by stylized metallic lotus flowers, in the style of mucha style, Alphonse Mucha meets cyberpunk, delicate linework, circular halo.»
Астронавт: «A woman in a retro-futuristic spacesuit holding a glowing planet, her helmet off with hair floating in zero gravity like flowing ribbons, in the style of mucha style, decorative cosmic background, stars and nebulas as Art Nouveau ornaments.»
Фэнтези-воительница: «A female elven warrior holding an ornate bow, wearing delicate silver armor, standing in a magical forest, in the style of mucha style, Art Nouveau illustration, intricate botanical borders, pastel palette.»
Современная реклама: «A vintage advertisement poster featuring an elegant modern woman holding a takeaway coffee cup, steam curling into stylized decorative swirls, in the style of mucha style, commercial lithograph, floral frame.»
Интерьер Бель Эпок: «A grand interior of a Parisian cafe during the Belle Epoque, stained glass windows, elegant patrons, in the style of mucha style, highly detailed decorative elements, soft lighting, pastel color grading.»
Симметрия (День и Ночь): «Two mirrored elegant women representing Day and Night, holding hands, their flowing dresses merging together, in the style of mucha style, perfectly symmetrical Art Nouveau composition, intricate floral background.»
Квадриптих времен года: «A wide composition showing four elegant women interacting with each other, each representing a different season, surrounded by appropriate seasonal foliage, in the style of mucha style, epic vintage poster, intricate borders, lithographic texture.»
сгенерированные изображения
Как мне кажется, нейросети удалось приблизиться к уникальному стилю Альфонса Мухи и передать его. В изображениях можно уловить характерную пастельную гамму, изящество женских поз, обилие флористических мотивов и узнаваемую попытку имитировать винтажные литографические плакаты.
сгенерированные изображения
И все же нельзя не отметить, что сгенерированные нейросетью изображения далеки от идеала. В первую очередь это касается знаменитых волос: ИИ часто забывает стилизовать их под толстые, декоративные «макаронины», скатываясь в фотореалистичную, рассыпчатую текстуру прически. Во-вторых, страдает логика орнаментов: круговые нимбы за спинами героинь часто теряют идеальную геометрическую симметрию, а рамки при детальном рассмотрении сливаются с фоном или ломаются. Лица девушек порой получаются слишком современными и объемными (3D), что разрушает плоскую графичную эстетику классического ар-нуво. Все эти вещи могут быть замечены даже непрофессиональным взглядом человека, не имеющего искусствоведческого образования.
Вывод
Итак, эксперимент с оцифровкой сложнейшего стиля Альфонса Мухи наглядно показывает, насколько далеко продвинулось обучение нейросетей. Если раньше ИИ с трудом справлялся с геометрической симметрией и графичными контурами, то современные флагманские модели, такие как Stable Diffusion 3.5, FLUX.1, Midjourney v6 и DALL-E 3, способны не только копировать витиеватую эстетику модерна, но и переносить её на совершенно новые концепты вроде киберпанка или космоса. Это открывает колоссальные возможности для дизайна, рекламы и концепт-арта.
сгенерированные изображения
В целом, глубокое дообучение нейросетей (LoRA/Fine-tuning) под конкретного художника — это мощнейший инструмент, который меняет парадигму визуального производства, требуя при этом уважительного и осознанного отношения к первоисточнику и его эстетическим принципам.
Для генерации промптов был использован ChatGPT