ВЕЛЬШ КОРГИ на Geograffee

Концепция

У моей семьи есть питомник вельш корги «Сап Алтын». Из-за этого и многого другого, корги я очень люблю. Моя мама занимается фотографией наших собак.

В рамках данного проекта, я решила взять фотографии корги, сделанные мамой и использовать их для обучения нейросети, таким образом не нарушая авторское право.

Для обучения используется одна порода собак, поэтому генерации должны получиться качественными.

Исходные изображения

Исходный размер 2530x2862

Процесс обучения

Обучение модели и написание кода проводилось в Google Colab. На Stable Difusion проводилось само обучение. Ниже я прикрепила основные моменты кода.

Исходный размер 1654x546

Проверяю мощности, после проверки что всё впорядке, устанавливаю необходимые библиотеки.

Исходный размер 1044x720

Загружаю исходные изображения и проверяю загрузились ли они, через их вывод.

Исходный размер 667x369

Команда обучает модель LoRA для Stable Diffusion XL в стиле корги.

Обучение идёт с экономией ресурсов, а результаты сохранятся в папку corgy_style_LoRA после 500 шагов обучения, промежуточный чекпоинт происходит на 250‑м шаге.

Исходный размер 925x613

Обучение модели завершилось успешно и я получаю ссылку на нее на HuggingFace.

Генерации

Исходный размер 1024x1024

«photo in CORGY style, sad dog»

Исходный размер 2690x2708

«photo in CORGY style, dog in bath» «photo in CORGY style, dog on couch» «photo in CORGY style, dog on table» «photo in CORGY style, christmas dog»

Исходный размер 1024x1024

«photo in CORGY style, dog on gren couch»

«photo in CORGY style, dog in the kitchen» «photo in CORGY style, dog in the kitchen, coocking»

Исходный размер 3152x1024

«photo in CORGY style, dog in flowers» «photo in CORGY style, dog in red flowers» «photo in CORGY style»

Исходный размер 1024x1024

«photo in CORGY style, dog, green background»

«photo in CORGY style, dog play with ball» «photo in CORGY style, dog play basketball»

Генерации вышли удачными, однако местами шея создавалась чересчур длинной, а язык выходил странно. Несмотря на эти недостатки, полученные изображения я считаю удачными, и поставленная мною цель выполнена.

Ссылка на модель

Ссылка на блокнот