
Состав презентации
1. Вводная часть 2. Этапы работы 3. Итоговые графики 4. Описание применения генеративной модели
Для проведения данного анализа данных я выбрала тему недвижимости, а именно: «Russia Real Estate 2021».
Эта тема показалась мне интересной, так как потенциально касается каждого из нас, ведь вопрос выбора и приобретения собственного недвижимого имущества рано или поздно становится актуальным для каждого жителя мегаполиса.
Источник данных: kaggle Виды используемых графиков: столбчатая диаграмма, ящик с усами, корреляционная матрица, матрица рассеивания.
Этапы работы
Подключаем библиотеку «Pandas». Загружаем данные и читаем их.




Большинство жителей обладают недвижимостью площадью меньше 50 м^2
Построим столбчатую диаграмму, которая показывает распределение данных. Ось х — значение данных Ось у — количество раз, сколько они встретились.
Большинство жителей 77-го региона проживают в квартирах с одной или двумя комнатами.
Построим диаграмму «ящик с усами», чтобы посмотреть выбросы данных.
Исходя из данного графика мы можем сделать вывод, что среди всего массива данных ярко выделяются однокомнатные и двухкомнатные квартиры, однако на графике было достигнуто значение « — 1», соотвественно данная квартира является студией.
Построим корреляционную матрицу, чтобы посмотреть, как между собой коррелируют данные.
- Мы можем наблюдать, что в корреляционной матрице наиболее изменчивыми значениями являются показатели количества комнат и площади квартиры, что в целом естественно. - На главной диагонали корреляционной матрицы стоят 1-c. Очевидно, поскольку значения полностью соотносятся сами с собой. - Остальные показатели корреляционной матрицы показывают неизмеримо низкую корреляция между вышеуказанными параметрами.
Построим матрицу рассеивания, которая помогает проследить как зависят данные.
Построив диаграмму рассеяния, мы видим, что в данных действительно нет очевидной линейной зависимости. Скорее всего, это связано с довольно большим начальным количеством строк в данных.
Описание применения генеративной модели
Для стилизации графиков я использовала Chat GPT «Open AI» Пример промпта: draw purple stripes on the graphics columns. Save the data».
Ссылка на файл
Ссылка на данные