Original size 923x1350

The art of BROM | Обучение генеративной нейросети

PROTECT STATUS: not protected
8

[01] КОНЦЕПЦИЯ

Проект The Art of BROM посвящен до-обучению нейросети Stable Diffusion под создание работ в стиле художника Джеральда Брома.


Джеральд Бром (Gerald Brom), известный просто как Бром — американский художник, писатель и бывший концепт-артист, работающий в жанрах тёмного фэнтези, готики и хоррора.

big
Original size 2480x1528

Слева: «Черная моль», Бром, 2018; справа: «Похититель душ», Бром, 2017

Большинство его работ — изображение различных персонажей в довольно мрачном антураже в жанре темного фэнтези с элементами готики, сюрреализма и викторианского ужаса.

Игра света и теней в его работах, а также поразительная детализация словно погружают зрителя в полную мистики и красоты старую сказку.

big
Original size 2480x1044

Слева: «Леди Бладстоун», Бром, 2018; по центру: «Демоница», Бром, 2017; справа: «Проклятье черного меча», Бром, 2016

Из важных особенностей работ американского художника можно отметить:

- Использование преимущественно мрачной гаммы в сочетании с интересным визуальным приёмом — подсвечивание или свечение персонажа.

- Виртуозная игра с анатомией, придающая индивидуальный характер каждому персонажу, и невероятная детализация.

- Работа с цветовыми и смысловыми контрастами.

- Окружение: оно часто прописано до мелочей и создаёт атмосферу, необходимую для раскрытия героя.

Original size 2480x1022

Слева: «Суд», Бром, 2016; по центру: без названия, Бром, 2015; справа: без названия, Бром, 2016

Наиболее известен Бром серией невероятно атмосферных иллюстраций к собственной книге — «Потерянные боги» (The Lost Gods), основными героями которой являются антропоморфные боги и демоны.

Эти изображения не просто дополняют сюжет, а становятся неотъемлемой его частью.

Original size 2480x770

Серия иллюстраций к книге Брома «Потерянные боги»

Original size 2480x1677

Серия иллюстраций к книге Брома «Потерянные боги»

[02] ПРОЦЕСС ОБУЧЕНИЯ

Всего для обучения нейросети я взяла 54 работы Брома, которые были предварительно приведены к разрешению 1024×1024 и отредактированы.

В качестве рабочей среды я выбрала Google Colab, так как там есть гарантированная возможность подключиться к GPU, хоть и на очень ограниченный промежуток времени.

В качестве подготовительного этапа были проверка GPU, а также установка всех необходимых для обучения модели библиотек и скриптов (ditsandbytes, diffusers).

0

Фрагмент кода

Следующим этапом было создание локальной директорий для хранения изображений, которые впоследствии были загружены на платформу.

Original size 2480x1350

Фрагмент кода

Original size 2480x1350

Фрагмент кода

Далее с помощью модели BLIP были созданы описания изображений и префикс «artwork in BROM style».

0

Фрагмент кода

После этого я создала личный кабинет на платформе Hugging Face, сгенерировала токен и приступила непосредственно к обучению модели с использованием LoRA. Весь процесс при заданных параметрах занял два с половиной часа.

Выставленные параметры были следующими: —resolution = 1024 —train_batch_size = 2 —max_train_steps = 500 —checkpointing_steps = 250

0

Фрагмент кода

Обученная модель затем была загружена на Hugging Face Hub для удобства дальнейшего использования.

После этого я приступила к первым генерациям.

Original size 2480x1230

Prompt: «artwork in BROM style, a spider-like woman with a knife in each hand»

Мои первые пробы генерации можно поделить на 3 блока:

— Необычные фантастические существа/монстры — Животные — Персонажи

Так как в использованном для обучения модели датасете превалируют иллюстрации персонажей, лучше всего нейросеть справилась именно с ними.

В случае же с генерацией животных и нечеловеческих существ нейросеть справлялась значительно хуже: более-менее сохранялись цветовая гамма и стиль рисования, присущие автору, но совсем терялась композиция, часто происходило непопадание в довольно специфическую стилизацию Брома, из-за чего большинство изображений выходили довольно нелепыми (особенно с животными).

Original size 2480x802

Prompt [1]: «artwork in BROM style, a dragon on the top of the mountain»

Prompt [2]: «artwork in BROM style, a unicorn in the forest»

Prompt [3]: «artwork in BROM style, a wolf standing on the edge of a cliff»

0

Prompt [1-2]: «artwork in BROM style, a towering, jackal-headed figure with obsidian-black fur, golden eyes that pierce the veil of death, and a skeletal frame draped in tattered funeral linens»

Prompt [3]: «artwork in BROM style, devil sitting on the throne in Hell»

Prompt [4]: «artwork in BROM style, a woman with white hair and a white dress stands in front of a black cat»

Prompt [6-7]: «artwork in BROM style, a smith-god of molten bronze, his skeletal hands hammering the sun into existence, his forge-heart burning behind ribs of blackened iron»

[03] РЕЗУЛЬТИРУЮЩАЯ СЕРИЯ ИЗОБРАЖЕНИЙ

Опираясь на результаты первых генераций и особенности творчества автора в качестве итоговой серии я решила попробовать создать иллюстрации известных богов различных культур в стиле Брома, как если бы автор делал это для собственной книги.

Велес

Original size 2480x802

Prompt: «artwork in BROM style, a horned, bearded figure, sometimes in the form of a serpent or a bull, embodying the underworld and cattle»

Перун

Original size 2480x1230

Prompt: «artwork in BROM style, a powerful, bearded warrior with a hammer or axe, wearing armor and commanding the stormy skies»

Сварог

Original size 2480x802

Prompt: «artwork in BROM style, an elderly, wise figure with a radiant crown, often holding a celestial forge hammer, representing fire and craftsmanship»

Даждьбог

Original size 2480x1230

Prompt: «artwork in BROM style, a radiant, golden-haired god, often driving a chariot across the sky, symbolizing the sun»

Морана

Original size 2480x1230

Prompt: «artwork in BROM style, а pale, skeletal goddess of winter, her hair a blizzard’s shriek, her touch rotting blossoms into frostbitten husks»

Зевс

Original size 2480x802

Prompt: «artwork in BROM style, a thunder-bearded titan with lightning-cracked eyes, his massive frame draped in storm clouds, radiating the scent of ozone and power»

Тор

Original size 2480x1230

Prompt: «artwork in BROM style, a muscular, red-bearded god of thunder, wielding a hammer and wearing armor»

Локи

Original size 2480x1230

Prompt: «artwork in BROM style, a mischievous, shape-shifting figure, often in a dark cloak and a sly grin»

Аполлон

Original size 2480x802

Prompt: «artwork in BROM style, a youthful, handsome god with a lyre, radiant and often depicted with a laurel wreath»

Фрейя

Original size 2480x1230

Prompt: «artwork in BROM style, a beautiful, golden-haired goddess with a cloak of falcon feathers, often riding a chariot pulled by cats»

Афина

Original size 2480x802

Prompt: «artwork in BROM style, an armored warrior with a helmet and spear, often accompanied by an owl»

Ра

Original size 2480x802

Prompt: «artwork in BROM style, а golden-skinned deity with the head of a falcon, crowned by a blazing sun disk, his body dripping molten light that scorches the sands beneath him»

Анубис

0

Prompt: «artwork in BROM style, a jackal-headed god, often seen as a protector of the dead with a black body symbolizing the afterlife»

Осирис

Original size 2480x802

Prompt: «artwork in BROM style, a green-skinned man, mummified, with a white crown of Upper Egypt and a crook and flail»

Гор

Original size 2480x1230

Prompt: «artwork in BROM style, a man with the head of a falcon, often wearing the double crown of Egypt»

Исида

Original size 2480x802

Prompt: «artwork in BROM style, a beautiful woman with a throne-shaped crown, often holding an ankh or a scepter»

[04] ИТОГ

В целом нейросеть отлично справилась со своей задачей: изображения вышли очень похожими на то, что делает сам автор. Наблюдаются те же композиции, ракурсы, позы персонажей, уровень детализации и цветовая гамма. Особенно радует очень точное в большинстве случаев попадание в мрачную и завораживающую эстетику Брома, а также его работу с анатомией.

Original size 2480x1230

Слева: оригинальная работа автора, 2019 г.; справа: генерация нейросети (prompt: a grim, one-eyed wanderer in a tattered cloak, his face etched with ancient runes, flanked by twin ravens)

Иногда у нейросети даже получалось передать образы нечеловеческих существ максимально близко к оригинальному авторскому стилю.

Original size 2480x1230

Слева: оригинальная работа автора, 2018 г.; справа: генерация нейросети (prompt: a small dark room in abandoned house full of monsters)

Из очевидных минусов можно отметить не слишком высокое разрешение на выходе, а также проблему с генерацией кистей рук, в частности пальцев. В редких случаях встречались перебои с цветовой гаммой.

[06] ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ

Stable Diffusion — использованная для обучения нейросеть.

BLIP — описание изображений датасета.

Hugging Face — получение токена для обучения нейросети и загрузка полученной модели.

DeepSeek — нейросеть, использованная для работы с промптами.

The art of BROM | Обучение генеративной нейросети
8