
Описание
Целью данного проекта является создание нейронной сети, обученной на произведениях Иеронима Босха и художников, работавших в схожей стилистике, для генерации новых, оригинальных изображений в босхианском духе. Проект направлен на исследование возможностей искусственного интеллекта в воспроизведении и интерпретации сложного и узнаваемого художественного стиля, а также на создание уникальных визуальных образов, вдохновленных работами великого мастера. Я хотела посмотреть, сможет ли нейросеть уловить суть этого сюрреалистичного и символичного стиля, и сгенерировать что-то новое, но в то же время узнаваемое.


Иероним Босх — нидерландский художник эпохи Северного Возрождения, известный своими фантастическими и сложными по символике картинами, наполненными гротескными существами и моральными аллегориями. Его работы, такие как «Сад земных наслаждений», отличаются уникальным иконографическим языком и мрачной сатирой, делающими его одним из самых узнаваемых художников в истории искусства.
Итоговая серия
Итоговая серия изображений демонстрирует интересные и необычные ландшафты, созданные нейронной сетью под влиянием стиля Иеронима Босха. Однако, стоит отметить, что они несколько отличаются от наиболее известных иконографических работ художника.
В сгенерированных изображениях преобладает акцент на объеме, близком к реализму, и ландшафте, в то время как характерные для Босха множественные сцены с детализированными персонажами и общей плоскостью изображения появляется меньше.
В процессе обучения нейросеть настолько «пропиталась» стилем Иеронима Босха, что даже на простой промпт «башня» был получен результат, поразительно напоминающий одн из самых известных его картин, посвящённых вавилонской башне.
Одной из проблем, возникших в процессе обучения, стало воспроизведение лиц. Оригинальные работы Босха часто отличаются некоторой схематичностью и искажением лиц, что, вероятно, затруднило задачу для нейросети. В результате, ИИ была склонна к созданию странных и даже комичных существ, которые, впрочем, вполне соответствуют общему духу босхианского сюрреализма и гротеска. Эти персонажи, хоть и не всегда идеально прорисованы, вносят свой вклад в атмосферу фантастического мира, созданного нейросетью.
Несмотря на некоторые ограничения, можно сказать, что обучение прошло успешно, учитывая ограниченность ресурсов (в данном контексте подразумевается, что обучение проводилось не на самых мощных вычислительных ресурсах и, возможно, с не самым большим объемом данных). Нейросеть смогла уловить ключевые элементы стиля Босха, такие как: • Фантастические ландшафты: Изображения наполнены причудливыми формами рельефа, неземными пейзажами и странными архитектурными сооружениями, что является характерной чертой босхианских картин. • Сюрреалистичные элементы: В работах присутствуют необычные сочетания объектов, абсурдные ситуации и искаженные пропорции, создающие атмосферу иррациональности и гротеска. • Гротескные существа: Изображения населены странными, деформированными и комичными существами, напоминающими демонов и чудовищ из работ Босха. • Использование ярких, контрастных цветов: Хотя не всегда удается идеально воспроизвести цветовую палитру Босха, в изображениях прослеживается тяга к ярким и контрастным цветам, что характерно для его стиля.
Ноутбук с кодом для обучения и описание процесса обучения:
Для обучения нейросети я использовала метод Fine-tuning Stable Diffusion XL с DreamBooth и LoRA, реализованный на бесплатном Colab Notebook с GPU T4. Fine-tuning позволил «настроить» предварительно обученную модель SDXL на специфический стиль Иеронима Босха, используя предоставленный набор изображений. DreamBooth использовался для «внедрения» концепции босхианского стиля в модель, а LoRA — для эффективного обучения без необходимости обновления всех параметров SDXL, что существенно снизило потребление ресурсов. Этот подход позволил добиться желаемого результата, несмотря на ограничения бесплатной платформы Colab.
Использование ГенИИ:
В проекте я активно применяла инструменты GenAI для оптимизации и достижения желаемого результата:
• SDXL DreamBooth LoRA: Эта нейросеть взята со страницы курса и стала основой для обучения и генерации изображений в стиле Иеронима Босха. • Нейросеть для улучшения качества фото: Столкнувшись с необходимостью улучшения детализации, я использовала нейросеть для повышения качества сгенерированных изображений: https://overscale.imagewith.ai/ • Chat GPT: На этапе планирования GPT помог с идеей проекта, промптами и описанием: https://chatgpt.com/