Original size 1131x1600

Анализ влияния марок и типов автомобилей на продажи

PROTECT STATUS: not protected
The project is taking part in the competition

Введение в тему

Я выбрала для анализа датасет «Продажи автомобилей», который содержит информацию о продажах различных марок и типов автомобилей.

Цель данного анализа заключается в определении влияния марок и типов автомобилей на объемы продаж.

Я стремлюсь выяснить, какие факторы способствуют увеличению продаж, а также выявить предпочтения потребителей. Это позволит лучше понять рынок и разработать стратегии для повышения конкурентоспособности. В дальнейшем будет проведен детальный анализ данных с использованием статистических методов и визуализации, что поможет в формулировании выводов и рекомендаций.

Типы диаграмм

В рамках исследования я использовала следующие типы диаграмм: 1. Столбчатая диаграмма 2. Круговая диаграмма 3. Столбчатая диаграмма 4. Ящичковая диаграмма «ящик с усами» 5. Столбчатая диаграмма с накоплением

Установка библиотек:

big
Original size 430x150
big
Original size 746x208

импорт в проект, чтобы воспользоваться

Original size 2080x770

Датасет содержит информацию о продажах автомобилей. Мне интересно проанализировать, какие марки и типы автомобилей влияют на объемы продаж. В дальнейшем подробнее рассмотрю этот вопрос.

Original size 1280x556

В данном разделе я подготавливаю цветовую палитру для графиков и изменяю шрифт на загруженный. Цветовую палитру предложил чат-бот Gemini, который считает эти цвета наиболее удачными для визуализации данных.

Original size 2051x530

В этом разделе я провожу подготовку данных: удаляю пустые значения по годам и обнуляю пробег для автомобилей, у которых он отсутствует. Я предполагаю, что такие автомобили являются новыми.

График № 1

Original size 1913x1059

В данном разделе я представляю столбчатую диаграмму, иллюстрирующую топ-10 брендов автомобилей и их распределение по типам трансмиссий. Для получения данных о наиболее популярный брендах был использован следующий код:

top_10_brands = df['brand'].value_counts ().nlargest (10).index df_top_10_brands = df[df['brand'].isin (top_10_brands)]

Цель данного графика — проанализировать, какие бренды автомобилей имеют наибольшие объемы продаж и какие типы трансмиссий они предлагают. Результаты показывают, что Toyota является самым популярным брендом, с преобладанием автоматических трансмиссий, в то время как Лада демонстрирует наибольшие продажи механических трансмиссий.

График № 2

Original size 1263x859

Анализ распределения типов трансмиссий, представленный на круговой диаграмме, демонстрирует доминирование автоматических коробок переключения передач (АКПП) на современном рынке. Доля механических трансмиссий (МКПП) составляет всего 26%, что свидетельствует о существенном снижении их популярности. Оставшиеся 74% приходятся на различные виды автоматических трансмиссий, включая вариаторы (CVT), роботизированные коробки передач (AMT/DSG) и классические «автоматы», что подтверждает их преобладание в структуре автомобильного производства.

График № 3

Original size 1854x952

Анализ динамики продаж автомобилей демонстрирует выраженный рост объемов реализации, преимущественно сосредоточенный в интервале с 2000 по 2020 годы. Этот значительный подъем контрастирует с показателями, зафиксированными до 1990 года, что объясняется изменением социально-экономического статуса автомобиля: от предмета роскоши к более доступному и массовому средству передвижения.

График № 4

Original size 1475x1007

Для анализа распределения пробега автомобилей, сгруппированных по десятилетним интервалам года выпуска, была применена диаграмма «ящик с усами» (box plot). Каждый элемент этой диаграммы предоставляет следующую статистическую информацию:

  • Горизонтальная линия внутри ящика: Обозначает медиану (50-й процентиль) пробега, указывая центральное значение, выше и ниже которого находится по 50% наблюдений.
  • Границы самого ящика: Соответствуют первому квартилю (Q1, 25-й процентиль) и третьему квартилю (Q3, 75-й процентиль) пробега, охватывая таким образом центральные 50% данных (меж квартильный диапазон).
  • «Усы» (вертикальные линии, выходящие из ящика): Показывают общий диапазон данных, исключая выбросы. Они обычно простираются до минимальных и максимальных значений, находящихся в пределах 1.5 меж квартильных диапазонов от Q1 и Q3 соответственно.

График № 5

Original size 1395x977

Последний график демонстрирует динамику продаж автомобилей по типу кузова в разные годы. Наибольший объем продаж зафиксирован в 2010 году, при этом наиболее популярным типом кузова были седаны. В 2020 году тенденция изменилась — лидирующую позицию заняли универсалы с пятью дверями.

Вывод

Датасет содержит комплексную информацию о продажах различных марок и типов автомобилей, что позволяет анализировать тенденции и предпочтения потребителей в разные периоды времени. Полученные данные отражают динамику популярности различных кузовов и брендов, выявляют изменения в спросе по годам и помогают прогнозировать развитие автомобильного рынка. Такой анализ способствует более обоснованным маркетинговым и стратегическим решениям в отрасли.