Original size 1140x1600

Генерация изображений в стиле Альбрехта Дюрера с помощью stable diffusion

Цель проекта

Цель проекта-обучить генеративную нейросеть Stable diffusion для создания новых изображений в стиле немецкого художника-графика Альбрехта Дюрера. Я стремилась получить гравюроподобные изображения, в которых прослеживаются характерные особенности манеры Дюрера: четкая штриховка, контраст, детализация и анатомическая точность.

Исходный датасет

Для обучения был собран датасет из 170 изображений оригинальных работ Альбрехта Дюрера. Изображения: приведены к квадратному формату (1:1) путём добавления белых рамок; охватывают как его известные гравюры (например, Меланхолия I, Адам и Ева), так и менее известные офорты, рисунки и эскизы;

Примеры изображений из датасета

Original size 1600x1140

Обучение модели

Для обучения использовалась методика LoRA DreamBooth на базе модели stabilityai/stable-diffusion-xl-base-1.0. Параметры обучения: max_train_steps=200 train_batch_size=1 fp16, 8bit Adam, gradient_checkpointing — для экономии памяти

Original size 2224x844

Original size 2224x1154

Original size 2222x1002

Original size 2212x614

Original size 2156x406

Вывод картинок из датасета

Original size 1600x1140

Загрузила модель BLIP для генерации текстовых описаний изображений

Original size 2246x686

Сохранила картинки вместе с их путями

Original size 2242x274

Сгенерила описания к изображениям

Original size 2126x630

Original size 2164x1002

Original size 2164x1202

Original size 2220x1206

Original size 2200x1224

Сохраняем обученную модель на Hugging face

Original size 2228x1212

Original size 2196x866

Полученные картинки

Генерирую и вывожу полученные картинки

Original size 1848x1212

Original size 2162x1216

Результат генерации

После обучения модель научилась воссоздавать изображения в гравюрной технике

Original size 1600x1140

Анализ и комментарии

Манера исполнения: модель успешно переняла гравюрную технику — чёткие линии, параллельную/перекрёстную штриховку. Анатомия и композиция: Хотя иногда наблюдаются неточности, общая композиция и дух работ Дюрера сохраняется. Передача света и тени: Используется классическая игра контрастов, где белый фон выделяет чёрную штриховку. Вариативность: В зависимости от промпта появляются разные композиционные решения и сюжетные ходы.

Использование ИИ

Помимо обученной модели, для генерации промптов и написания пояснений использовалась модель ChatGPT: Для генерации текстовых описаний (промптов).

Дополнительные материалы

https://huggingface.co/datasets/anyuta0001/Durer https://huggingface.co/datasets/anyuta0001/Durer https://huggingface.co/datasets/anyuta0001/Durer/blob/main/durer.ipynb https://drive.google.com/drive/folders/1qH8rAMUMFV_Uj4FUL8md6c8jazaiOoWK?hl=ru

Генерация изображений в стиле Альбрехта Дюрера с помощью stable diffusion

Anna Zapryagaeva

artificial intelligence