Original size 1140x1600

Генерация изображений в стиле Альбрехта Дюрера с помощью stable diffusion

PROTECT STATUS: not protected
3

Цель проекта

Цель проекта-обучить генеративную нейросеть Stable diffusion для создания новых изображений в стиле немецкого художника-графика Альбрехта Дюрера. Я стремилась получить гравюроподобные изображения, в которых прослеживаются характерные особенности манеры Дюрера: четкая штриховка, контраст, детализация и анатомическая точность.

Исходный датасет

Для обучения был собран датасет из 170 изображений оригинальных работ Альбрехта Дюрера. Изображения: приведены к квадратному формату (1:1) путём добавления белых рамок; охватывают как его известные гравюры (например, Меланхолия I, Адам и Ева), так и менее известные офорты, рисунки и эскизы;

Примеры изображений из датасета

big
Original size 1600x1140

Обучение модели

Для обучения использовалась методика LoRA DreamBooth на базе модели stabilityai/stable-diffusion-xl-base-1.0. Параметры обучения: max_train_steps=200 train_batch_size=1 fp16, 8bit Adam, gradient_checkpointing — для экономии памяти

Original size 2224x844
Original size 2224x1154
Original size 2222x1002
Original size 2212x614
Original size 2156x406

Вывод картинок из датасета

Original size 1600x1140
Original size 1600x1140

Загрузила модель BLIP для генерации текстовых описаний изображений

Original size 2246x686

Сохранила картинки вместе с их путями

Original size 2242x274

Сгенерила описания к изображениям

Original size 2126x630
Original size 2164x1002
Original size 2164x1202
Original size 2220x1206
Original size 2200x1224

Сохраняем обученную модель на Hugging face

Original size 2228x1212
Original size 2196x866

Полученные картинки

Генерирую и вывожу полученные картинки

Original size 1848x1212
Original size 2162x1216

Результат генерации

После обучения модель научилась воссоздавать изображения в гравюрной технике

Original size 1600x1140
Original size 1600x1140

Анализ и комментарии

Манера исполнения: модель успешно переняла гравюрную технику — чёткие линии, параллельную/перекрёстную штриховку. Анатомия и композиция: Хотя иногда наблюдаются неточности, общая композиция и дух работ Дюрера сохраняется. Передача света и тени: Используется классическая игра контрастов, где белый фон выделяет чёрную штриховку. Вариативность: В зависимости от промпта появляются разные композиционные решения и сюжетные ходы.

Использование ИИ

Помимо обученной модели, для генерации промптов и написания пояснений использовалась модель ChatGPT: Для генерации текстовых описаний (промптов).

Дополнительные материалы

Генерация изображений в стиле Альбрехта Дюрера с помощью stable diffusion
3