

Смерть касается каждого. Через числа мы видим тенденции, за которыми стоят жизни, утраты и боль.

Я выбрала для анализа датасет, который включает информацию о причинах смертности по всему миру за период с 2000 по 2020 годы. Этот набор данных содержит информацию о различных болезнях, таких как сердечно-сосудистые заболевания, рак, инфекционные болезни, а также о факторах риска, таких как ВИЧ/СПИД. Эти данные были собраны и опубликованы международной организацией Global Health Data Exchange. Сам датасет можно найти на платформе Kaggle. Эти данные предоставляют возможность понять, как изменялись причины смерти в разных странах и как это отражает глобальные проблемы здравоохранения.
Почему это важно
Анализ причин смертности имеет огромное значение не только для оценки состояния здравоохранения, но и для выявления социальных и экономических проблем. Этот проект помогает глубже понять, какие болезни по-прежнему занимают лидирующие позиции в мировой смертности, а также какие изменения происходят с течением времени. Для меня, как исследователя, важно, чтобы анализ не только показывал цифры, но и передавал эмоции и атмосферу. Оттенки серого, которые я использую в визуализации, символизируют печаль, пустоту и утрату, что подчеркивает драматичность темы. Смерть, как неизбежный процесс, влияет на все общество, и с каждым годом эти числа могут менять судьбы людей и целых стран.
Кроме того, процесс визуализации и стилизации графиков был вдохновлён современным подходом в инфографике, что связано с поиском нового визуального языка для столь серьезных и эмоционально насыщенных тем. Я использовала Midjourney для создания обложки и некоторых элементов дизайна.
Этапы работы и код
1. Подготовка данных с Pandas Перед началом анализа данных, я импортировала и очистила датасет с помощью библиотеки Pandas. Это важный этап, так как данные, полученные из различных источников, часто содержат пропущенные значения или ошибки, которые могут повлиять на точность анализа.
Импорт и очистка: Для начала я загружала данные с помощью функции pd.read_csv (). После этого я внимательно проверяла датасет на пропуски в значениях с помощью метода .isnull (), а также проверяла на аномалии, такие как отрицательные значения или нереалистичные данные. Это позволило мне получить чистый набор данных, который можно было использовать для дальнейшего анализа.
Группировка по годам и странам: После очистки данных я начала группировать их по годам и странам, чтобы проанализировать изменения в смертности за различные временные промежутки. Я использовала метод .groupby (), чтобы агрегировать данные по нужным признакам, и суммировала значения смертности по каждой причине.
2. Отбор причин смерти Далее, я выбрала несколько ключевых причин смертности для анализа. В частности, я решила сосредоточиться на наиболее значимых заболеваниях, таких как сердечно-сосудистые заболевания, рак и ВИЧ/СПИД, так как эти болезни занимают ведущие позиции среди причин смерти. Для этого я отфильтровала нужные столбцы из датафрейма.
3. Нейросети и инструменты В процессе разработки визуализаций и стилизации графиков я использовала нейросеть ChatGPT для помощи в оптимизации кода. Она помогала создавать правильные запросы на стилизацию, а также подсказывала, как лучше организовать визуализации для достижения желаемого эффекта.
4. Стилизация графиков На этом этапе я приступила к стилизации графиков, которые должны были быть выполнены в определенном минималистичном стиле. Все графики были сделаны с использованием оттенков серого (например, цвета: #e6e6e6, #bfbfbf, #4d4d4d и т. д.), что символизирует печаль, пустоту и утрату. Этот стиль подчеркивает важность темы смертности и болезни.
Цветовая гамма: Для всех графиков я использовала градиенты серого и несколько оттенков, чтобы создать ощущение монохромной инфографики, характерной для современных дизайнерских решений в области минимализма. Черный фон добавлял контраста и создавал настроение пустоты и утери.
Шрифт: Я использовала Helvetica, один из самых чистых и универсальных шрифтов. Этот шрифт был подключен вручную с помощью библиотеки matplotlib.font_manager, чтобы обеспечить единую стилистику всех графиков.
5. Итоговые графики После подготовки данных и стилизации графиков, я приступила к созданию визуализаций. Вот несколько ключевых графиков:
Столбчатая диаграмма: Топ-5 причин смерти (2000–2020). На этом графике лидируют сердечно-сосудистые заболевания, что подтверждает их важность среди глобальных проблем здравоохранения.
Пузырьковая диаграмма: Смертность от ВИЧ/СПИДа по странам в 2020 году. Этот график показывает страны с наибольшим количеством смертей от ВИЧ/СПИДа и дает представление о глобальных усилиях по борьбе с этим заболеванием.
Круговая диаграмма: Соотношение смертей по четырем ключевым причинам (сердечно-сосудистые болезни, ВИЧ/СПИД, рак и инфекционные болезни).
Сложенная область: Динамика смертности от трёх заболеваний (ВИЧ/СПИД, рак, сердечно-сосудистые заболевания) во времени. Мы видим, как смертность от ВИЧ/СПИДа снижается, в то время как рак и сердечно-сосудистые заболевания продолжают расти.
Заключение
Мир всё ещё умирает от «классических» болезней На протяжении последних двух десятилетий наибольшее число смертей по-прежнему связано с заболеваниями, такими как сердечно-сосудистые болезни, рак и инфекционные заболевания. Влияние пандемий, таких как ВИЧ/СПИД, заметно снизилось, благодаря мировым усилиям по профилактике и лечению. Однако хронические заболевания, как-то сердечно-сосудистые болезни и рак, продолжают занимать ведущие позиции среди причин смерти. Одной из наиболее тревожных тенденций, показанных в анализе данных, является рост смертности из-за старения населения. С увеличением продолжительности жизни, стареющие общества сталкиваются с большими проблемами с хроническими заболеваниями. Каждая цифра на графиках — это не просто статистика.Это миллионы жизней, утрат и историй. За каждым числом стоит реальная судьба людей, семей и целых поколений. Эти графики напоминают нам о том, что несмотря на технологические и медицинские достижения, мы всё равно сталкиваемся с фундаментальными вызовами здоровья. Важно помнить, что любая болезнь не только влияет на физическое состояние человека, но и имеет социальные, экономические и культурные последствия.