Концепция
Цель данного проекта заключается в том, чтобы обучить нейросеть Stable Diffusion для создания серии изображений деловых кроликов в костюмах в моём художественном стиле.
Мне необходимо было добиться того, чтобы искусственный интеллект смог повторить необычные, даже сюрреалистичные формы, как на моих рисунках, и при этом создать целостную картину с приемлемой композицией и понятными силуэтами.
Мои рисунки из датасета
С помощью профессионального графического редактора Adobe Photoshop я собственноручно создала рисунки кроликов-офисных планктонов в костюмах, которые в дальнейшем пригодятся для обучения искусственного интеллекта.
Процесс обучения
Для создания проекта я руководствовалась предоставленным в самом задании кодом, а также видеоуроками курса. Показанные ранее 10 изображений я применила для создания обучающего нейросеть кода. Для программирования я использовала платформу Kaggle.
Процесс подготовки базы данных с моими рисунками кроликов
После успешной подготовительной части и выгрузки датасета со своими деловыми кроликами я создала токен на платформе Hugging Face и приступила к этапу обучения.
Финальные настройки перед самым важным этапом — обучением
Нейросеть «осмысляла» моих офисных кроликов более двух часов и показала довольно неплохие результаты, которые также продемонстрированы в данном проекте.
Завершение процесса обучения и создание промптов
Результирующая серия изображений
Написав промпты, я получила следующие изображения от нейросети.
photo collage of humanoid rabbits in formal suits, a rabbit drinks from a glass of water
photo collage of humanoid rabbits in formal suits, a rabbit plays with a ball
photo collage of humanoid rabbits in formal suits, a red balloon
photo collage of humanoid rabbits in formal suits, the rabbit is watching TV
photo collage of humanoid rabbits in formal suits, a rabbit flies using butterfly wings
photo collage of humanoid rabbits in formal suits, a rabbit sits on a chair with high legs
photo collage of humanoid rabbits in formal suits, a rabbit is riding a bicycle
photo collage of humanoid rabbits in formal suits, an orange rabbit eats a hamburger
photo collage of humanoid rabbits in formal suits, a purple bag
photo collage of humanoid rabbits in formal suits, the blue rabbit with a big sun
Вывод
Созданные искусственным интеллектом изображения оправдали мои ожидания. Мультипликационный, немного безумный стиль был передан довольно достоверно, в особенности эти уставшие, недовольные лица бедных кроликов в костюмах. Однако были и недочёты: нейросеть порой дорисовывала деловым товарищами аномальное количество ушей или кого-то вообще оставляла лишь с одним единственным ухом. Тем не менее даже это показалось мне уместным, учитывая немного абстрактный характер моих работ.
Сравнение моего рисунка (слева) и рисунка от нейрости (справа). Между этими зелёными кроликами очень много сходств!
Сравнение моего рисунка (слева) и рисунка от нейрости (справа). Загадочная аномалия с ушами!
Ссылка на ноутбук




