
Цель проекта
Цель проекта-обучить генеративную нейросеть Stable diffusion для создания новых изображений в стиле немецкого художника-графика Альбрехта Дюрера. Я стремилась получить гравюроподобные изображения, в которых прослеживаются характерные особенности манеры Дюрера: четкая штриховка, контраст, детализация и анатомическая точность.
Исходный датасет
Для обучения был собран датасет из 170 изображений оригинальных работ Альбрехта Дюрера. Изображения: приведены к квадратному формату (1:1) путём добавления белых рамок; охватывают как его известные гравюры (например, Меланхолия I, Адам и Ева), так и менее известные офорты, рисунки и эскизы;
Примеры изображений из датасета

Обучение модели
Для обучения использовалась методика LoRA DreamBooth на базе модели stabilityai/stable-diffusion-xl-base-1.0. Параметры обучения: max_train_steps=200 train_batch_size=1 fp16, 8bit Adam, gradient_checkpointing — для экономии памяти
Вывод картинок из датасета
Загрузила модель BLIP для генерации текстовых описаний изображений
Сохранила картинки вместе с их путями
Сгенерила описания к изображениям
Сохраняем обученную модель на Hugging face
Полученные картинки
Генерирую и вывожу полученные картинки
Результат генерации
После обучения модель научилась воссоздавать изображения в гравюрной технике
Анализ и комментарии
Манера исполнения: модель успешно переняла гравюрную технику — чёткие линии, параллельную/перекрёстную штриховку. Анатомия и композиция: Хотя иногда наблюдаются неточности, общая композиция и дух работ Дюрера сохраняется. Передача света и тени: Используется классическая игра контрастов, где белый фон выделяет чёрную штриховку. Вариативность: В зависимости от промпта появляются разные композиционные решения и сюжетные ходы.
Использование ИИ
Помимо обученной модели, для генерации промптов и написания пояснений использовалась модель ChatGPT: Для генерации текстовых описаний (промптов).
Дополнительные материалы