Original size 1140x1600

Анализ статистики лесных пожаров

PROTECT STATUS: not protected

Концепция

В последние годы угроза лесных пожаров становится все более актуальной проблемой. Последний крупный инцидент, произошедший в январе этого года в Калифорнии, произвел на меня особое впечатление, поэтому, найдя датасет с данными о лесных пожарах конкретно в этом регионе, я сразу решила узнать больше именно о нем.

Сет содержит информацию о пожарах с 2014 по 2023 год, их местах, причинах и последствиях (включая и человеческие жертвы, и финансовый вред).

Внешний вид проекта основан в первую очередь на противопоставлении контрастных цветов и вдохновлен образом огня посреди ночного неба.

big
Original size 1185x670

Для визуализации я выбрала: гистограмму (чтобы нагляднее показать масштабы изменения тренда через соотношение величин), линейный график (чтобы точнее проследить этот тренд), круговую диаграмму (лучше всего подходящую для небольшого количества параметров) и точечную диаграмму (наоборот, хорошо визуализирующую большой массив данных).

Обработка данных

big
Original size 1700x425

После импорта нужных библиотек и считывания CSV-файла с датасетом я первым делом для удобства добавила отдельный столбец с годом происшествия. Изначально в сете содержалась только дата целиком, но т. к. я планировала собирать статистику по годам, нужно было выделить оттуда первые четыре символа.

После этого я сгруппировала все параметры в базе данных по году в отдельной переменной и для построения первого графика посчитала для каждого длину колонки с уникальным номером инцидента.

Original size 1807x292

При построении второго графика я посчитала количество вхождений каждой возможной причины в изначальном датасете.

Original size 1807x292

В третьем графике я подсчитала сумму колонки «Fatalities» для каждого года.

Original size 1807x172
Original size 1807x292

Четвертый график — простое сопоставление элементов двух колонок, а для построения пятого я снова группирую элементы, но по месту происшествия, после чего считаю сумму содержимого колонок.

Визуализация

Original size 2250x900

Первым шагом стал, естественно, подсчет динамики количества пожаров. В короткий промежуток, описанный в датасете, видимого его увеличения с течением времени не наблюдалось…

Original size 2250x900

…но вот количество смертей в последние годы заметно увеличилось.

Original size 2250x900

Самой распространенной причиной пожаров были действия людей, но количество случившихся из-за них инцидентов отличалось от количества произошедших по неизвестным причинам и из-за ударов молний лишь слегка. Других вариантов зарегистрировано не было.

Original size 2250x900

Поскольку в сете было много информации о последствиях пожаров для имущества, я также решила посмотреть на него и рассчитать, есть ли прямая зависимость между финансовым вредом и человеческими жертвами. При взгляде на последствия конкретных инцидентов четкого тренда не наблюдалось.

Original size 2250x900

После этого я рассмотрела те же данные, но на этот раз суммированные для отдельных областей. Здесь зависимость прослеживалась более явно и был заметен огромный разрыв в количествах так или иначе пострадавших в разных регионах.

Анализ статистики лесных пожаров