

Концепция
Заболевание лёгких — одна из самых распространенных причин смертности в мире. Как в прошлом, так и в настоящем людям все ещё приходится сталкиваться с тяжёлыми болезнями органов дыхания, как пневмония, бронхит или рак. Актуальность темы заключается в том, что заболевания легких по-прежнему представляют собой серьезную угрозу для здоровья каждого человека.
Мне было интересно проанализировать эти данные, чтобы лучше понять распространенность и закономерность заболеваний легких, а также то, как курение влияет на состояние здоровья.

В своем анализе я использовала датасет с сайта kaggle.com.
Для визуализации данных я выбрала круговую диаграмму (наглядно показывает процент выздоровевших и соотношение полов), гистограмму (легче всего понять количество пациентов в конкретном возрасте), столбчатую диаграмму (увидеть, как курение влияет на наличие заболевания), горизонтально столбчатую диаграмму (самые распространение заболевания) и тепловую карту корреляции (попытаться найти взаимосвязь между разными факторами).
Этапы работы и единство стиля

В визуализации графиков я решила взять палитру с обложки при помощи Adobe Color. Я выбрала такую яркую, контрастирующую палитру, поскольку хотела акцентировать внимание на серьезности данной темы, а также зелёный, который напоминает мне о здоровых лёгких.
Был использован простой лаконичный шрифт liberation serif, взятый из библиотеки Google Collab.
Для оформления кода я использовала carbon.now.sh.
Графики


Круговая диаграмма показывает, что число пациентов с проблемами дыхания между мужчинами и женщинами практически одинаковое, однако пациентов-женщин немного больше, чем мужчин.
С помощью гистограммы мы можем увидеть, что заболевания легких начинают заметно прогрессировать в возрастной группе от 20 до 30 лет. После количество пациентов остается относительно стабильным до 75 лет, затем наблюдается небольшой пик ближе к 80 годам, с последующим существенным снижением числа пациентов в более старших возрастных группах.
Представленная столбчатая диаграмма показывает влияние курения на различные типы заболеваний легких. Визуально можно заметить, что для большинства заболеваний (ХОБЛ, бронхит, астма) количество пациентов среди курящих немного выше, чем среди некурящих. Однако, особенно важно отметить, что пневмония имеет относительно высокую распространённость как среди курящих, так и среди некурящих, а количество заболевших раком легких явно больше у курящих.
Горизонтальная столбчатая диаграмма демонстрирует распределение количества пациентов по различным типам заболеваний легких. Бронхит, астма и ХОБЛ являются наиболее распространенными заболеваниями в данной выборке, в то время как рак легких и пневмония встречаются реже.


Процент выздоровевших пациентов (50.9%) лишь незначительно превышает процент невыздоровевших (49.1%), что подтверждает опасность этих типов болезней для человеческого организма.
Представленная тепловая карта корреляции демонстрирует отсутствие значимой линейной взаимосвязи между количеством посещений больницы, возрастом пациентов и емкостью их легких. Все коэффициенты корреляции между этими переменными находятся вблизи нуля (0.019 или -0.011), что говорит о том, что увеличение или уменьшение одного из этих параметров не связано с предсказуемым изменением других.
Вывод
Проведенный анализ данных о заболеваниях легких демонстрирует, что эта проблема может затронуть каждого. Хотя распространенность болезней относительно равномерна, курение оказывает существенное влияние на развитие конкретных заболеваний, в особенности рака легких.
Использованные ресурсы
Датасет с платформы Kaggle (дата обращения: 22.03.2025)
Adobe Color — визуализация палитры проекта
ChatGPT4 | Midjourney — использован для генерации идей для анализа
Carbon.now.sh (дата обращения: 22.03.2025)