Original size 1140x1600

Russia Real Estate 2021 Data Analysis

PROTECT STATUS: not protected
16

Состав презентации

1. Вводная часть 2. Этапы работы 3. Итоговые графики 4. Описание применения генеративной модели

Для проведения данного анализа данных я выбрала тему недвижимости, а именно: «Russia Real Estate 2021».

Эта тема показалась мне интересной, так как потенциально касается каждого из нас, ведь вопрос выбора и приобретения собственного недвижимого имущества рано или поздно становится актуальным для каждого жителя мегаполиса.

Источник данных: kaggle Виды используемых графиков: столбчатая диаграмма, ящик с усами, корреляционная матрица, матрица рассеивания.

Этапы работы

Подключаем библиотеку «Pandas». Загружаем данные и читаем их.

big
Original size 2727x786
big
Original size 2745x909
big
Original size 1426x138
big
Original size 1154x926

Большинство жителей обладают недвижимостью площадью меньше 50 м^2

Построим столбчатую диаграмму, которая показывает распределение данных. Ось х — значение данных Ось у — количество раз, сколько они встретились.

Original size 1793x143
Original size 1250x895

Большинство жителей 77-го региона проживают в квартирах с одной или двумя комнатами.

Построим диаграмму «ящик с усами», чтобы посмотреть выбросы данных.

Original size 1591x125
Original size 1202x851

Исходя из данного графика мы можем сделать вывод, что среди всего массива данных ярко выделяются однокомнатные и двухкомнатные квартиры, однако на графике было достигнуто значение « — 1», соотвественно данная квартира является студией.

Построим корреляционную матрицу, чтобы посмотреть, как между собой коррелируют данные.

Original size 1728x150
Original size 515x418

- Мы можем наблюдать, что в корреляционной матрице наиболее изменчивыми значениями являются показатели количества комнат и площади квартиры, что в целом естественно. - На главной диагонали корреляционной матрицы стоят 1-c. Очевидно, поскольку значения полностью соотносятся сами с собой. - Остальные показатели корреляционной матрицы показывают неизмеримо низкую корреляция между вышеуказанными параметрами.

Построим матрицу рассеивания, которая помогает проследить как зависят данные.

Original size 2794x1033
Original size 2313x1580

Построив диаграмму рассеяния, мы видим, что в данных действительно нет очевидной линейной зависимости. Скорее всего, это связано с довольно большим начальным количеством строк в данных.

Описание применения генеративной модели

Для стилизации графиков я использовала Chat GPT «Open AI» Пример промпта: draw purple stripes on the graphics columns. Save the data».

Ссылка на файл

Ссылка на данные

Russia Real Estate 2021 Data Analysis
16