Original size 1968x3072

Тренды шоппинга

PROTECT STATUS: not protected
The project is taking part in the competition

Мы живём в мире капитализма…

Каждый раз, когда мы прикладываем карту к терминалу или нажимаем кнопку «Оплатить» в приложении, мы не просто совершаем покупку — мы генерируем данные. В современном ритейле информация о том, кто, что и когда купил, стала новой валютой, по ценности порой превосходящей саму прибыль от сделки. Понимание этих скрытых паттернов — это разница между успешным бизнесом и тем, который работает вслепую.

Именно поэтому для своего проекта я выбрал датасет «Shopping Behavior Trends». Это не просто сухая таблица с цифрами, а слепок реального потребительского поведения 3900 человек. Мне было важно выяснить, действительно ли существуют те «идеальные покупатели», о которых пишут в маркетинговых статьях, или же наши траты — это хаос, не зависящий ни от возраста, ни от сезона.

Для проекта я выбрал датасет Shopping Behavior Trends, содержащий информацию о 3900 транзакциях покупателей. Данные представлены в формате CSV и включают такие параметры, как возраст, пол, категория товара, сумма покупки, сезон, рейтинг отзыва и способ оплаты.

big
Original size 1600x635

Распределение возраста покупателей

big
Original size 1516x862

Статистический метод: гистограмма с наложением линии плотности распределения.

Это позволяет понять демографическое ядро вашей аудитории. Также мы отметим средний возраст.

Original size 2816x1929

Популярность категорий товаров по сезонам

Original size 1776x1013

Метод: частотный анализ категориальных данных

Я использовал группировку по двум признакам: «Сезон» и «Категория». Это позволяет увидеть не только общий спрос но и структуру спроса.

Original size 2816x2180

Заголовок

Original size 1171x1176

Статистический метод: анализ структуры. Мы смотрим, из каких долей состоит целое.

Скорее всего, вы увидите, что доли распределены очень равномерно (примерно по 16-17%).

Original size 2816x2129

Заголовок

Original size 1776x876

Метод: трендовый анализ (хотя здесь ось X — это возраст, а не время, принцип тот же: зависимость Y от изменения X).

Я использую агрегацию, чтобы снизить шум.

Original size 2816x2142

Заключение

Как пример, можно сказать, что данные разрушили несколько популярных мифов. Мы часто думаем, что молодежь тратит меньше, а подписчики программ лояльности — больше, но мой анализ показал, что средний чек удивительно стабилен и почти не зависит от возраста или статуса подписки. Это говорит о том, что покупательская способность распределена равномернее, чем кажется на первый взгляд.

Главный вывод проекта прост: чтобы понять клиента, нужно смотреть не на интуицию, а на цифры. И в данном случае цифры показали, что поведение покупателя — это сложная система, где отсутствие явных корреляций (как в случае с возрастом и суммой чека) — это тоже важный бизнес-инсайт, позволяющий не ограничивать целевую аудиторию узкими рамками.