Концепция
У моей семьи есть питомник вельш корги «Сап Алтын». Из-за этого и многого другого, корги я очень люблю. Моя мама занимается фотографией наших собак.
В рамках данного проекта, я решила взять фотографии корги, сделанные мамой и использовать их для обучения нейросети, таким образом не нарушая авторское право.
Для обучения используется одна порода собак, поэтому генерации должны получиться качественными.

Процесс обучения
Обучение модели и написание кода проводилось в Google Colab. На Stable Difusion проводилось само обучение. Ниже я прикрепила основные моменты кода.
Проверяю мощности, после проверки что всё впорядке, устанавливаю необходимые библиотеки.
Загружаю исходные изображения и проверяю загрузились ли они, через их вывод.
Команда обучает модель LoRA для Stable Diffusion XL в стиле корги.
Обучение идёт с экономией ресурсов, а результаты сохранятся в папку corgy_style_LoRA после 500 шагов обучения, промежуточный чекпоинт происходит на 250‑м шаге.
Обучение модели завершилось успешно и я получаю ссылку на нее на HuggingFace.
Генерации
«photo in CORGY style, sad dog»
«photo in CORGY style, dog in bath» «photo in CORGY style, dog on couch» «photo in CORGY style, dog on table» «photo in CORGY style, christmas dog»
«photo in CORGY style, dog on gren couch»


«photo in CORGY style, dog in the kitchen» «photo in CORGY style, dog in the kitchen, coocking»
«photo in CORGY style, dog in flowers» «photo in CORGY style, dog in red flowers» «photo in CORGY style»
«photo in CORGY style, dog, green background»


«photo in CORGY style, dog play with ball» «photo in CORGY style, dog play basketball»
Генерации вышли удачными, однако местами шея создавалась чересчур длинной, а язык выходил странно. Несмотря на эти недостатки, полученные изображения я считаю удачными, и поставленная мною цель выполнена.




