
Введение в тему
Я выбрала для анализа датасет «Продажи автомобилей», который содержит информацию о продажах различных марок и типов автомобилей.
Цель данного анализа заключается в определении влияния марок и типов автомобилей на объемы продаж.
Я стремлюсь выяснить, какие факторы способствуют увеличению продаж, а также выявить предпочтения потребителей. Это позволит лучше понять рынок и разработать стратегии для повышения конкурентоспособности. В дальнейшем будет проведен детальный анализ данных с использованием статистических методов и визуализации, что поможет в формулировании выводов и рекомендаций.
Типы диаграмм
В рамках исследования я использовала следующие типы диаграмм: 1. Столбчатая диаграмма 2. Круговая диаграмма 3. Столбчатая диаграмма 4. Ящичковая диаграмма «ящик с усами» 5. Столбчатая диаграмма с накоплением
Установка библиотек:


импорт в проект, чтобы воспользоваться
Датасет содержит информацию о продажах автомобилей. Мне интересно проанализировать, какие марки и типы автомобилей влияют на объемы продаж. В дальнейшем подробнее рассмотрю этот вопрос.
В данном разделе я подготавливаю цветовую палитру для графиков и изменяю шрифт на загруженный. Цветовую палитру предложил чат-бот Gemini, который считает эти цвета наиболее удачными для визуализации данных.
В этом разделе я провожу подготовку данных: удаляю пустые значения по годам и обнуляю пробег для автомобилей, у которых он отсутствует. Я предполагаю, что такие автомобили являются новыми.
График № 1
В данном разделе я представляю столбчатую диаграмму, иллюстрирующую топ-10 брендов автомобилей и их распределение по типам трансмиссий. Для получения данных о наиболее популярный брендах был использован следующий код:
top_10_brands = df['brand'].value_counts ().nlargest (10).index df_top_10_brands = df[df['brand'].isin (top_10_brands)]
Цель данного графика — проанализировать, какие бренды автомобилей имеют наибольшие объемы продаж и какие типы трансмиссий они предлагают. Результаты показывают, что Toyota является самым популярным брендом, с преобладанием автоматических трансмиссий, в то время как Лада демонстрирует наибольшие продажи механических трансмиссий.
График № 2
Анализ распределения типов трансмиссий, представленный на круговой диаграмме, демонстрирует доминирование автоматических коробок переключения передач (АКПП) на современном рынке. Доля механических трансмиссий (МКПП) составляет всего 26%, что свидетельствует о существенном снижении их популярности. Оставшиеся 74% приходятся на различные виды автоматических трансмиссий, включая вариаторы (CVT), роботизированные коробки передач (AMT/DSG) и классические «автоматы», что подтверждает их преобладание в структуре автомобильного производства.
График № 3
Анализ динамики продаж автомобилей демонстрирует выраженный рост объемов реализации, преимущественно сосредоточенный в интервале с 2000 по 2020 годы. Этот значительный подъем контрастирует с показателями, зафиксированными до 1990 года, что объясняется изменением социально-экономического статуса автомобиля: от предмета роскоши к более доступному и массовому средству передвижения.
График № 4
Для анализа распределения пробега автомобилей, сгруппированных по десятилетним интервалам года выпуска, была применена диаграмма «ящик с усами» (box plot). Каждый элемент этой диаграммы предоставляет следующую статистическую информацию:
График № 5
Последний график демонстрирует динамику продаж автомобилей по типу кузова в разные годы. Наибольший объем продаж зафиксирован в 2010 году, при этом наиболее популярным типом кузова были седаны. В 2020 году тенденция изменилась — лидирующую позицию заняли универсалы с пятью дверями.
Вывод
Датасет содержит комплексную информацию о продажах различных марок и типов автомобилей, что позволяет анализировать тенденции и предпочтения потребителей в разные периоды времени. Полученные данные отражают динамику популярности различных кузовов и брендов, выявляют изменения в спросе по годам и помогают прогнозировать развитие автомобильного рынка. Такой анализ способствует более обоснованным маркетинговым и стратегическим решениям в отрасли.