Original size 1140x1600

Обучение генеративных нейросетей

PROTECT STATUS: not protected
7

Концепция

Основная цель проекта — обучить нейросеть, способную понимать и самостоятельно воспроизводить уникальный художественный стиль выбранного автора. Нейросеть обучается на обширной базе данных, состоящей из работ этого художника, анализируя характерные черты его стиля и пытаясь их воссоздать.

В рамках данного исследования в качестве основы для обучения искусственного интеллекта были выбраны работы известного CG-художника WLOP (Ван Линг). Его произведения, отличающиеся уникальной эстетикой, сочетанием детализации и атмосферности, стали отправной точкой для изучения возможностей нейросети в области визуального искусства.

Исходные изображения

Стиль WLOP (Ван Линг) — это уникальное сочетание цифровой живописи, аниме-эстетики и реализма, которое выделяется своей атмосферностью, эмоциональной глубиной и технической виртуозностью.

big

«Festival»

big

«Black Hole»

Работы WLOP отличаются насыщенной атмосферой, часто с меланхоличным или загадочным настроением. Художник искусно передаёт эмоции через позы персонажей, их мимику и общую композицию. Особое внимание он уделяет свету, создавая объёмные и динамичные сцены с выразительными контрастами. Композиции в его работах часто асимметричны и наполнены движением, что придаёт им энергию и визуальную выразительность. Многие из его произведений включают фантазийные элементы, такие как крылья, магические эффекты или необычные детали фона, что добавляет им сюрреалистичности.

«Abyss»

«Burst»

«Moon Fragments»

«Chinese New Year»

«Chinese New Year»

«Chinese New Year»

«Distance»

«Stella»

Основное внимание в творчестве WLOP уделено женским персонажам, которые изображены с изяществом и грацией. Художник подчёркивает их индивидуальность через позы, выражения лиц и окружающую обстановку. Вероятно, он использует 3D-моделирование для создания базовых сцен, которые затем дорабатывает вручную, добавляя фактурные мазки кисти и другие детали в процессе постобработки.

Сгенерированные изображения

«photo in dark and fantastical WLOP’s style, A mysterious warrior in armor, a translucent cape billowing in the wind, with a ruined city shrouded in mist in the background»

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, Two characters, a man and a woman, standing face to face, in rage, tired from battle, injured and exausted, in a ruined temple.»

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, Two children running through a bustling festival, holding candy sticks, with dragon dancers in the background. Vibrant colors and soft light. »

Можно отметить, что нейросети тяжело даются работы с высокой детализацией, они выходят очень абстрактными и больше силуэтными.

«photo in dark and fantastical WLOP’s style, A young woman with long, flowing hair standing on the edge of a cliff, gazing into the distance at sunset. Atmospheric lighting, soft shadows, romantic mood»

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, A girl in a dress made of flowers, surrounded by fireflies in a nighttime forest. Soft glow, fairy-tale atmosphere.»

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, Cozy living room corner: soft light from floor-to-ceiling windows, a couch with a throw blanket, a book on a wooden coffee table, a geometric rug.»

«photo in dark and fantastical WLOP’s style, Kitchen with a bar counter: metal stools, a vase with flowers, a fruit basket, natural light»

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, A lone musician playing a guzheng under a canopy of cherry blossoms, lanterns glowing softly around him. Peaceful festival atmosphere.»

В отрисовке человеческих лиц нейросеть крайне не стабильна, в некоторых генерациях они получаются четко, в других же смазано.

«photo in dark and fantastical WLOP’s style, A girl in a sweater sits on a windowsill, a neon city and rain outside. She holds a cup of tea, soft lamp light in the background. Cozy cyberpunk »

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, Two children running through a bustling festival, holding candy sticks, with dragon dancers in the background. Vibrant colors and soft light. »

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, A young woman in a traditional qipao holds a glowing lantern, surrounded by festive red decorations. Fireworks light up the night sky.»

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, A royal guard in ornate armor stands at attention in a grand hallway, her spear gleaming. Intricate carvings and red pillars frame the scene.»

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, A royal scholar paints in a grand hall, surrounded by scrolls and ancient artifacts. Sunlight streams through ornate windows, illuminating the dust»

В результате удалось добиться передачи основных черт стиля художника WLOP. Самой удачной вышла генерация по короткому промту без уточнения деталей. Нейросеть смогла воспроизвести лицо персонажа, сохранив стиль характерный художнику.

Original size 1024x1024

«photo in dark and fantastical WLOP’s style, queen of darkness»

Вывод

Основная цель проекта — обучить нейросеть, способную понимать и воспроизводить уникальный художественный стиль выбранного автора, — была достигнута. Нейросеть успешно научилась анализировать и воссоздавать характерные черты стиля WLOP, такие как атмосферность, работа со светом и тенью, а также характерные мазки кистью. Однако в процессе обучения были выявлены и некоторые ограничения. Например, нейросеть не всегда точно передаёт детали, особенно в прорисовке лиц и мелких элементов, что может снижать уровень реализма и узнаваемости стиля.

Несмотря на эти недостатки, проект демонстрирует значительный потенциал использования нейросетей в визуальном искусстве. Технологии такого рода открывают новые возможности для творчества, позволяя экспериментировать с художественными стилями и ускоряя процесс создания контента. В то же время важно продолжать совершенствовать алгоритмы, чтобы минимизировать ошибки и повысить точность воспроизведения деталей.

Генеративная модель

В процессе подготовки проета была использована языковая нейросеть DeepSeek для генерации промтов и исправления синтаксических и грамматических ошибок.

Файл с кодом

Обучение генеративных нейросетей
7
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more