Идея проекта:

Питер Брейгель Старший (1525–1569) — ключевая фигура Северного Возрождения. Его стиль отличает уникальный контраст между величием мира и суетой человека — умение сочетать детализированное и, на первый взгляд, обыденное повествование с эпическим размахом. Работы Брейгеля — и энциклопедия крестьянской жизни XVI века, и метафоры целого мира.
справа: «Художник и знаток» Питер Брейгель Старший около 1565 г.
«Детские игры», 1560 г. / «Охотники на снегу», 1565 г. / «Жатва», 1565 г. / «Битва Масленицы и Поста», 1559 г.
Картины Брейгеля можно долго и с интересом разглядывать из-за огромного количества сцен и сюжетов, разворачивающихся в одном пространстве. Художник обращался не к возвышенной, а к простой, актуальной ему жизни людей и города, и из этого пристального разглядывания повседневности родилась идея проекта: мне стало интересно, что получится, если «перенести» стиль Брейгеля в генеративную модель, и попробовать применить его визуальный язык и взгляд к новым, нехарактерным для художника, но ставшими обыденными для нас, сюжетам? Увидеть, как Брейгель изобразил бы небоскрёбы, перекрёстки, уличные кафе и парки? Это исследование, как при помощи модели можно адаптировать стиль к совершенно иному контексту.
Процесс обучения модели


«Охотники на снегу» — фрагмент, 1565 г. / «Нидерландские пословицы» — фрагмент, 1559 г.
Я собрала датасет на основе известных картин художника, предварительно обрезав их до квадратных сегментов. Получился набор из 73 изображений с различными сценами, фигурами и деталями. Все картины были взяты с сайта WikiArt, и находятся под лицензией Public Domain (CC0), поэтому их можно использовать для обучения.
Все изображения были приведены к размеру 512×512. Это немного упростило детали, но позволило стабильно провести обучение.
изображения из собранного датасета
В проекте я обучила LoRA-модель на базе Stable Diffusion XL.
Обучение проходило в Google Colab.
Для работы я установила необходимые библиотеки: diffusers, transformers, accelerate, peft, bitsandbytes. Датасет я загружала через Google Drive.
Для описания и последующего лучшего понимания моделью содержания изображений я использовала нейросеть BLIP для автоматического описания каждого кадра.
Дальше я приступила к обучению модели Stable Diffusion XL с помощью метода DreamBooth LoRA. Обучение заняло около 800 шагов и длилось немного меньше часа. После обучения я сохранила получившуюся LoRA-модель на Google Drive и приступила к генерации, добавляя в каждый промпт ключевые слова «painting in bruegel_style, flemish renaissance, many small figures».
По итогу всех генераций было создано 11 изображений, повторяющий художественный стиль Питера Брейгеля Старшего.
Рядом с изображениями указаны промты, которые были использованы для их генераций.
Результаты


modern city street with skyscrapers, busy crowd of people, cars and trams, coffee shops / modern city square with fountain, skyscrapers background, people sitting at cafes, street performers, bicycles
С полученной моделью сразу удалось создать сюжеты с характерной цветовой палитрой и композицией. И следующим шагом стало двинуться в сторону отказа не только от сюжетов, но и от исторических мотивов в окружении — попытка переосмыслить современные панорамы города.
spacious city park with modern skyscrapers in background, people walking dogs, children playing, joggers, benches, fountain, autumn trees, sunny afternoon, detailed landscape
промпты для изображений ниже: central park with modern buildings around, people walking, jogging, children playing, autumn trees / construction site of a modern skyscraper, cranes and workers, city skyline, scaffolding, urban development


busy city intersection with cars, taxis, bicycles, pedestrians crossing crosswalk, traffic lights, modern buildings all around, painting in bruegel_style, dynamic urban scene, many small figures, city energy
glass building with people playing table tennis, outdoor ping pong table, players with paddles hitting ball, small crowd watching and cheering, children playing nearby, apartment buildings cloudy day
glass building with people playing table tennis, outdoor ping pong table, players with paddles hitting ball, small crowd watching and cheering, children playing nearby, apartment buildings around
В некоторых изображениях современные конструкции удалось стилизовать под замысловатые невозможные постройки, совмещающие стилистические элементы с картин художника и современные силуэты. Особенно интересными примерами этого совмещения стала кольцевая автомобильная развязка, а также повторяющиеся «брейгелевские» небоскребы.
промпты для квадратных изображений ниже: interchange in modern city, overpasses and underpasses, cars, concrete structures, google maps satellite view \ top-down view of city roundabout with traffic circle, cars circulating, multiple exits leading to different streets, surrounding buildings, trees, google maps satellite view, geometric urban design


Самыми интересными для меня стали изображения с вертикальной ориентацией — в них удалось совместить и масштабную перспективу, и переосмысленные новые формы.
промпты для изображений выше: tall modern skyscraper dominating the composition, busy city intersection below with traffic lights, pedestrians crossing zebra crossing, cars waiting at red light, wide street with clear road markings, street lamps, detailed urban architecture, dramatic perspective looking up at skyscraper / tennis court in foreground with players hitting ball, massive modern skyscraper rising behind park trees, green grass, net, spectators, city skyline, bright sunny day, vibrant colors, warm earth tones, many small figures, detailed scene
Итоги:
В итоговых изображениях удалось интересно совместить исходный стиль и создать замысловатые, невозможные сюжеты, увлекательные для разглядывания и имеющие потенциал для последующего тиражирования (например, как фоны, открытки, плакаты).
В первую очередь, модели удалось передать характерную цветовую гамму и композиционные решения — сохранить монументальность и всеобъемлющий взгляд Брейгеля, а благодаря концептуально подходящим сюжетам в промптах удалось достичь и характерной Брейгелю многофигурности и насыщенности пространства.
Описание применения генеративной модели:
Проект был создан с использованием нейросетей
Генеративная модель Stable Diffusion XL с BLIP и LoRA.
Deepseek (перевод и детализация промптов, помощь в корректировке кода)










