
концепция
Цель проекта — научить генеративную нейросеть не просто копировать его работы, а создавать новые изображения, которые сохраняют дух и эстетику великого мастера.
Для обучения модели был собран набор из изображений, включающий картины и фрагменты работ Ван Гога. Эти изображения стали для нейросети своего рода учебником: она училась понимать характерные мазки, богатую цветовую палитру и ту эмоциональную глубину, которая делает работы Ван Гога узнаваемыми с первого взгляда.
Результатом стали новые изображения, созданные искусственным интеллектом. На них можно увидеть элементы, которые отсылают к знаменитым работам художника: завихрения звёздного неба, яркие и живые пейзажи, насыщенные оттенки жёлтого и синего. Это не просто имитация — это новый взгляд на стиль Ван Гога через призму современных технологий.
Не просто имитация, а новый взгляд на стиль Ван Гога через призму современных технологий. Проект как диалог между прошлым и будущим.
Он показывает, как искусственный интеллект может стать инструментом для сохранения и переосмысления искусства, создавая работы, которые одновременно напоминают о гении прошлого и открывают новые горизонты для творчества.
исходные изображения для обучения

Для обучения генеративной нейросети был собран уникальный набор изображений, вдохновлённых творчеством Винсента Ван Гога. Этот датасет включал 42 работы художника и их фрагменты, которые стали основой для глубокого погружения модели в его стиль.
Особое внимание уделялось разнообразию изображений. В датасет вошли как знаменитые шедевры, такие как «Звёздная ночь», «Подсолнухи» и «Ирисы», так и менее известные работы, которые позволяют глубже понять художественные приёмы мастера. Это позволило нейросети изучить не только характерные мазки и цветовые сочетания, но и эмоциональную насыщенность сюжетов.
Каждое изображение было адаптировано под формат 1:1 для корректного обучения модели. Этот процесс включал обрезку и обработку изображений, чтобы сохранить ключевые элементы композиций и обеспечить их соответствие требованиям генеративной нейросети.
процесс обучения нейросети. попытки
Процесс обучения генеративной нейросети Stable Diffusion в стиле Винсента Ван Гога оказался сложным и многогранным. На начальных этапах модель только начинала осваивать характерные черты стиля мастера: динамичные мазки, насыщенные цвета и эмоциональную глубину. Однако первые результаты были далеки от идеала — изображения содержали артефакты, неестественные линии и недостаточную детализацию.
На представленных изображениях можно заметить, что модель пыталась воспроизвести характерные завихрения и текстуры, свойственные работам Ван Гога. Например, на некоторых изображениях угадываются элементы пейзажей. Тем не менее, в этих первых попытках нейросеть ещё не смогла достичь гармонии в цветовых переходах и текстурных эффектах. Некоторые участки изображений выглядят размытыми или чрезмерно упрощёнными, что указывает на необходимость дальнейшего обучения.
Несмотря на несовершенство начальных попыток, они являются важным этапом в процессе обучения модели. Каждое изображение позволяет анализировать ошибки и корректировать параметры для достижения более точной передачи стиля художника. Теперь перейдём к анализу кода проекта и разбору характеристик изображений.
анализ характеристик изображений
Нейросеть смогла уловить основные элементы стиля Ван Гога: закрученные линии, контрастные цвета (жёлтые и синие тона), динамику мазков. Однако в некоторых местах текстуры выглядят упрощёнными или размытыми, что может быть связано с недостаточным количеством эпох обучения.
На некоторых изображениях заметны артефакты: лишние линии или неестественные формы объектов. Это указывает на необходимость дополнения датасета или увеличения числа эпох.
Генерации демонстрируют разнообразие композиций, от абстрактных пейзажей до фантазийных сцен. Однако модель пока не всегда точно передаёт глубину и сложность оригинального стиля.
Итоговые изображения показывают прогресс модели в освоении стиля Ван Гога. Несмотря на недочёты, они отражают основные черты его работ. Это подтверждает потенциал технологии для создания новых произведений в духе мастера.
результирующая серия изображений
В итоговой серии каждое изображение — это попытка искусственного интеллекта передать уникальные черты творчества мастера: динамичные мазки, насыщенные цвета и эмоциональную глубину, которые делают его работы узнаваемыми.
На первом изображении передан зимний пейзаж, наполненный движением и жизнью. Снежная метель и множество фигур людей создают ощущение шумного праздника, а деревья, покрытые снегом, добавляют композиции динамики. Нейросеть сумела уловить элементы хаотичных мазков, характерных для стиля Ван Гога.
Второе изображение представляет сцену битвы, где динамика композиции подчёркивает напряжение момента. Красные и зелёные оттенки создают контраст, а фигуры людей выглядят будто ожившими в вихре мазков. Здесь особенно заметно стремление нейросети передать движение через характерные завихрения линий.
Третье изображение — закат с ярким солнцем в жёлто-оранжевых тонах. Это работа наиболее близка к стилю Ван Гога: мазки создают текстуру света, а палитра передаёт тепло и энергию закатного солнца. Композиция напоминает знаменитую «Звёздную ночь», но в новой интерпретации.
Вариации в итоговой серии демонстрируют способность нейросети адаптироваться к стилю художника и использовать его элементы для создания новых сюжетов. Таким образом, итоговая серия не только сохраняет визуальные особенности работ Ван Гога, но и раскрывает потенциал искусственного интеллекта как инструмента для переосмысления искусства.
Связь с концепцией проекта очевидна: нейросеть стала своеобразным продолжением творчества Ван Гога в цифровой эпохе. Она не просто копировала его стиль — она пыталась создать что-то новое, вдохновлённое его наследием. Этот эксперимент показывает, как технологии могут взаимодействовать с искусством прошлого, сохраняя его дух и одновременно открывая новые горизонты для творчества.
процесс обучения нейросети
Для обучения генеративной нейросети в стиле Винсента Ван Гога был использован метод Dreambooth с использованием LoRA (Low-Rank Adaptation) на базе модели Stable Diffusion XL (SDXL). Этот подход позволяет эффективно адаптировать модель к специфическому стилю, используя ограниченные вычислительные ресурсы.
Проверка доступности GPU (Tesla P100). Установка необходимых библиотек: bitsandbytes — для 8-битной оптимизации. transformers, accelerate, peft — для работы с моделями и тонкой настройки. diffusers — для работы с диффузионными моделями. Загрузка скрипта обучения Dreambooth LoRA из репозитория Hugging Face.
Создание папки vangog для хранения датасета. Копирование изображений из заранее подготовленного набора данных в формате 1:1, который включает 42 картины Ван Гога. Предварительный просмотр изображений с помощью функции image_grid.
Использование LoRA для уменьшения количества обучаемых параметров. Применение 8-битного Adam-оптимизатора и FP16 для экономии VRAM. Обучение проводилось на 100 шагах, что является минимальным количеством для базовой адаптации модели.
Настройка параметров обучения
После завершения обучения модель была протестирована на генерацию изображений с промтами, созданным с нейросетью ChatGPT. Результаты были представлены в виде серии изображений ранее.
описание применения генеративной модели
ChatGPT использовался для консультации и исправления ошибок при написании кода. Промпты были написаны также с его помощью, чтобы добавить больших подробностей, а также повысить качество генераций. Для оформления текста проекта на портфолио был использован Claude AI