Концепция


Моя давняя любовь к творчеству младшей сестры, к её уникальному, искреннему, чуть наивному, но невероятно выразительному стилю детских рисунков, вдохновила меня на следующий проект. Я захотела обучить генеративную нейросеть Stable Diffusion создавать персонажей именно в этом неповторимом стиле.
Мне всегда было интересно, как бы выглядели иллюстрации к популярным детским сказкам, если бы их автором была именно она, с её особой оптикой и нетронутым взрослым миром видением. Этот проект призван ответить на вопрос: какими бы вышли эти иллюстрации, наполненные её искренним почерком, и как нейросеть сможет перенести эту детскую непосредственность в новые, волшебные образы для знакомых историй. Это будет попытка увидеть мир сказок через призму чистого, неподдельного искусства.
Список использованных в проекте инструментов:
Stable Diffusion — обучение генеративной нейросети под свой стиль; Google Colab — выполнение кода и генераций; Hugging Face — получение токена для обучения нейросети, загрузка полученной модели на сайт; Adobe Photoshop — для обработки фото (улучшение, кадрирование)
Примеры рисунков


Описание процесса обучения
Начнем с настройки технической среды: проверяем доступность GPU, инсталлируем необходимые библиотеки, обновляем фреймворк diffusers до последней версии и загружаем обучающий скрипт для DreamBooth под SDXL. Данный этап формирует инфраструктурный фундамент для реализации проекта.
Переходим к подготовке обучающего набора данных, состоящего из 23 рисунков. Для ускорения обработки все изображения заранее приведены к компактному формату 512×512 пикселей. В процессе создаётся целевая директория «cher», предназначенная для загрузки снимков, на основе которых нейросеть будет обучаться распознаванию заданного образа.
Проверим установки, выведя 5 случайных изображений.
Приступаем к созданию текстовых описаний для каждой фотографии в датасете с использованием модели BLIP. К полученным описаниям добавляем единый префикс — «a photo of TOK girl», — который впоследствии будет служить ключевым запросом для генерации новых изображений. После завершения процесса генерации подписей освобождаем оперативную память, чтобы снизить нагрузку на вычислительную среду и обеспечить стабильность дальнейших операций.
Переходим к установке требуемых зависимостей и авторизации в системе Hugging Face. Этот шаг служит страховкой на случай сбоя выполнения кода в Google Colab — после обучения модель можно будет загрузить на платформу и продолжить генерацию изображений непосредственно через веб-интерфейс.
Приступаем к процессу обучения модели. Для оптимизации вычислений и снижения нагрузки на GPU устанавливаем количество шагов обучения: 500 и 250. В параметры также обязательно включаем тот же префикс для текстовых запросов, который использовался при подготовке обучающего датасета. После завершения обучения сохраняем итоговую модель на платформе Hugging Face и получаем прямую ссылку на её страницу.
Генерация иллюстраций
Все иллюстрации сгенерированы в Goggle Colab
Напоминаю: промт начинался с заголовка «a photo of TOK girl,», поскольку эта фраза привязана к нашему началу обучения, с помощью этого заголовка нейросеть понимает с каким датасетом/темой мы работаем. Я в дальнейшем буду записывать лишь свой текст для создания картиной, без заголовка.
Кот в сапогах, Красная Шапочка
Сreate the heroine of the story, Little Red Riding Hood, as she walks through the forest picking mushrooms, with the wolf lurking nearby
Draw a children’s drawing for the story of Puss in Boots. The cat is standing on its hind legs, wearing large boots and a feathered hat. Behind it is a castle. All the lines are simple, and the colors are bright.
Золотой петушок
A children’s drawing: a golden cockerel on a high spire is screaming and pointing its wing to the side. King Dodon, wearing a red hat, is looking at it. The colors are bright, the shapes are simple, and the palace towers are in the background.
Дюймовочка
A children’s drawing: a tiny girl, Thumbelina, sitting in the cup of a large yellow flower. Butterflies and a ladybug fly around. Bright colors, simple shapes, and green grass.
Гадкий утёнок, Три поросёнка и Курочка ряба
A children’s drawing: a ugly duckling, gray and sad, stands next to beautiful yellow ducklings on a pond. Bright colors, simple shapes.
A children’s drawing: three piglets are building houses out of straw, twigs, and bricks. A wolf is blowing on a straw house. Bright colors and simple shapes.
Children’s drawing: Hen and Rooster, Grandfather and Grandmother, and a broken golden egg with a chicken inside. Bright colors and simple shapes.
Русалочка
A children’s drawing: a tiny girl, Thumbelina, sitting in the cup of a large yellow flower. Butterflies and a ladybug fly around. Bright colors, simple shapes, and green grass.
Гуси-лебеди
Create a picture for the fairy tale The Geese-Swans in a children’s style. Show how the geese-swans carry away a little boy. His sister, wearing a bright scarf, runs after them and cries. Draw dense fir trees, Baba Yaga’s hut in the distance, and a dark forest. Keep the lines simple and the colors bright and contrasting.
Сивка-бурка, Спящая красавица, Снежная Королева
Draw a children’s drawing for the fairy tale about Sivka-Burka. Ivan the Fool is sitting on the back of the magical horse Sivka-Burka, which is flying over the forest. The horse is large, white with a golden mane, and has large wings like a bird. Ivan is wearing a simple shirt and is holding onto the mane. Draw a small forest of green triangles and a small house below. The sun is shining in the corner. All the lines are simple and bold, and the colors are bright.
Draw a children’s drawing for the fairy tale Sleeping Beauty. Show the princess sleeping on a bed in a castle. She has her eyes closed and her arms folded across her chest. The prince is standing next to her, leaning down to kiss her forehead. Draw roses and sleeping animals around them. The characters have simple faces, and the castle is depicted as a tall house with turrets. The lines are rough, and the colors are vibrant.
Create an illustration for the Snow Queen fairy tale in the style of a children’s drawing. Show Kai and Gerda in their garden with roses before the trouble happened. The children are watering the flowers together with a watering can. The sun is shining brightly, and butterflies are flying around. Use simple shapes and bright colors. The lines should be clear and slightly uneven, as if drawn with colored pencils. Make the illustration light, warm, and childishly naive. Avoid adding complex details or shadows.
Колобок
Create an illustration for the Russian fairy tale about Kolobok. Use a child’s drawing style that is simple and easy to understand. Draw a round Kolobok with a smile and rosy cheeks. He is rolling along a forest path. He meets a Hare on his way. The Hare is sitting in a meadow and looking at Kolobok in surprise. In the background, show some fir trees and birch trees. Use bright colors, but not too much. The lines should be thick and slightly uneven, as if they were drawn with a pencil or marker. The picture should be fun and kind. Don’t make the characters scary or complicated.
Теремок
Create a bright and detailed illustration for the Russian fairy tale Teremok in the style of a naive children’s drawing using colored pencils and watercolors. Draw the teremok as a colorful wooden house with a triangular roof painted in red and yellow stripes. The walls of the teremok should be brown, with blue windows and a green door with a smiling daisy on it. An important rooster with an orange tail resembling fire sits on the roof, looking into the distance. Near the teremka, depict all the animal friends: A norushka Mouse in a pink blouse who sweeps the porch with a large broom, a croaking Frog in a blue handkerchief sitting on a mushroom fly agaric and playing a small accordion, a bouncing Bunny in green pants who rolls a wooden cart with carrots along the path, a Fox sister in a beautiful In a sundress with polka dots, she holds a bouquet of wildflowers in her paws, a spinning top is a gray barrel in a blue jacket, which carries a bucket of water on a stick. All the animals must be drawn
Репка
Create a very long and detailed illustration in the style of a child’s drawing, as if it was drawn by a child, for the Russian fairy tale about the turnip. All the lines should be slightly uneven and shaky, as if drawn by a child’s hand, and the contours should be bold, as if drawn with a black marker. Use the brightest and purest colors, like those in a box of pencils, and let them extend slightly beyond the contours for a sense of naivety. In the center, draw a huge, gigantic yellow turnip in the shape of a perfect circle, making it immediately noticeable. The turnip should be bright yellow, almost like the sun, and add an orange circle on one side, as if it were a blush. On top of the turnip, draw lush green leaves that look like waves, and fill them in with different shades of green pencil.Grandfather is holding on to the turnip tightly. Draw him first. Grandfather is wearing a simple blue shirt, which is filled in with a uniform shade of blue, and gray trouser pants. Draw him with a large gray beard that resembles a cloud of curls. Let his face be simple
Принцесса-лягушка
Create a colorful illustration in the style of a children’s drawing for the fairy tale about the Frog Princess. The main plot is the moment when Ivan Tsarevich finds a frog in a swamp holding his arrow in its paws. Draw Ivan Tsarevich as a handsome young man in a bright blue caftan with golden circle buttons and red boots. He should have big round eyes, rosy cheeks, and a smile. He stands on the edge of a swamp, drawn with blue-green wavy lines, and looks at the frog in surprise. The frog itself is large, green, with bulging ball-shaped eyes and flipper-like legs. In one of its legs, it holds a golden arrow with a red feather, and with the other, it seems to be waving at Ivan. The frog should have a small triangular crown on its head, adorned with red gemstones. Around the frog, draw water lilies in the form of simple green circles with white flowers, as well as reeds — long brown sticks with fluffy brown tops. In the background, draw a dark, dense forest consisting of brown tree trunks
Длинные, описательные промты написаны deepseek
Вывод
Результаты генерации иллюстраций с использованием промптов, основанных на стилистике рисунков моей сестры, оказались для меня весьма неожиданными и, безусловно, положительными. Нейросети удалось успешно уловить ключевые особенности детской манеры рисования: резкие, энергичные штрихи; яркую, контрастную палитру без полутонов; а также ту самую непосредственность и условность в изображении форм, которые характерны для детского восприятия. Особенно удивительным и точным оказалось то, как модель передала фактуру — структуру бумаги, лёгкую деформацию листа и естественное освещение, будто рисунок был выполнен на реальной бумаге и сфотографирован, что максимально приблизило результат к изображениям из исходного датасета. Полученные иллюстрации сохранили дух наивного искусства, что и было основной целью проекта.
В ходе экспериментов было отмечено, что наиболее качественные и соответствующие задумке результаты нейросеть выдаёт на короткие, лаконичные промпты, чётко описывающие сцену, главных героев и ключевой атрибут. Длинные и излишне детализированные описания, напротив, часто обрабатываются хуже: нейросеть начинает додумывать и комбинировать элементы произвольным образом, что приводит к потере смысла. Например, в одном из запросов «репка» была интерпретирована просто как «девочка», а «царевна-лягушка» превратилась в гибрид одежды принца и облика лягушки. Также наблюдалась тенденция к упрощению многофигурных композиций — так, «теремок» иногда генерировался без животных-обитателей.
Таким образом, для эффективной генерации иллюстраций в стиле детского рисунка оптимальной стратегией является использование простых, ёмких промптов, фокусирующихся на самой сути сцены, а не на её литературном или описательном изложении. Это позволяет нейросети лучше следовать заданной стилистике и избегать смысловых ошибок, сохраняя при этом непосредственность и яркость детского художественного языка, а также убедительную естественность фактуры и освещения.
Хотя итоговые изображения действительно порадовали меня своей эстетикой, живостью и точной передачей детской непосредственности, эксперимент наглядно показал ключевое ограничение современных нейросетей. Модель, даже обученная на конкретном датасете и управляемая промптом, не способна достоверно воспроизводить задуманный сюжет или строго следовать логике нарратива.
В процессе генерации регулярно возникали смысловые отклонения: появлялись лишние персонажи, исчезали ключевые герои или искажались их количество и взаимодействие. Например, в иллюстрации к сказке «Три поросёнка» иногда появлялось не три, а два, четыре и более персонажа, а в сцене из «Теремка» могли отсутствовать некоторые звери-обитатели.
Это подтверждает, что нейросети, при всей их впечатляющей способности стилизовать и генерировать визуально привлекательные образы, остаются инструментом, а не творческим субъектом. Они не понимают контекста, причинно-следственных связей и авторского замысла. Их «творчество» — это вероятностная компиляция паттернов, а не осознанное создание истории.
Таким образом, несмотря на все успехи в передаче стиля и настроения, нейросети не могут заменить человека-художника, особенно там, где требуется точность сюжета, смысловая целостность и глубина художественного высказывания. Они — мощный помощник в руках автора, но не его замена.
Несмотря на все отмеченные ограничения и смысловые неточности, этот эксперимент оказался весьма интересным и ценным опытом. Полученные иллюстрации, пусть и не всегда соответствующие изначальному сюжету, вышли живыми, неожиданными и по-своему выразительными. В них сохранилась та самая детская магия, непосредственность и яркость, которые изначально вдохновляли эту работу.
Каждая сгенерированная картинка стала своеобразной интерпретацией сказки через призму обученной модели — иногда буквальной, иногда абстрактной, но всегда визуально привлекательной. Это напоминает о том, как сам ребёнок может пересказывать знакомую историю, добавляя свои детали или упуская что-то важное, но делая это искренне и образно.
Таким образом, даже с учётом всех «минусов» и творческих несоответствий, результат можно считать успешным с художественно-экспериментальной точки зрения. Он показал, как технология может стать соавтором, предлагая неожиданные визуальные ходы, и напомнил, что процесс создания образов — это всегда диалог между замыслом, материалом и инструментом. И этот диалог, как оказалось, может быть очень увлекательным.
Пусть ваша жизнь будет такой же радужной, как рисунки моей сестры!




