Original size 832x1248

Анализ психологии стресса

PROTECT STATUS: not protected
The project is taking part in the competition

В датасете содержится информация о сне, уровне стресса и субъективной продуктивности людей. Всего в выборке — несколько тысяч наблюдений, что делает возможным анализ не отдельных случаев, а общих закономерностей психологического состояния.

Это большой объём информации о повседневном опыте человека. Я решила проанализировать эти данные, чтобы понять, как связаны между собой количество сна, уровень стресса и ощущение собственной продуктивности, а также какие паттерны поведения можно обнаружить в масштабной выборке.

Все данные были взяты из открытых источников (платформа Kaggle).

Работу можно условно разделить на три этапа: получение, предобработка и обработка данных. На этапе получения данные были загружены в формате CSV. Далее из датасета были удалены невалидные и ошибочные значения, после чего с помощью библиотеки Pandas были выполнены анализ данных и построение графиков.

Почему именно эти данные

Это большой объём информации о повседневном психологическом состоянии человека. Я решила проанализировать эти данные, чтобы понять, как связаны между собой сон, стресс и ощущение собственной продуктивности, и какие устойчивые паттерны можно выявить при работе с масштабной выборкой.

Тема сна и стресса является одной из ключевых в психологии, так как напрямую связана с когнитивными функциями, эмоциональным состоянием и качеством жизни. Анализ подобных данных позволяет перейти от частных наблюдений к более общим закономерностям и визуально показать влияние психологических факторов на повседневную эффективность.

big
Original size 1248x832

Получение данных

На первом этапе датасет был загружен из открытого источника в формате CSV и импортирован в среду Google Colab для дальнейшей работы. Для анализа использовалась библиотека Pandas.

После загрузки данных был выполнен первичный обзор структуры таблицы и состава столбцов.

Предобработка данных

На этапе предобработки данные были приведены в пригодный для анализа вид. В частности:

• удалены строки с пропущенными значениями; • исключены некорректные значения (например, отрицательное количество часов сна); • проверены типы данных и при необходимости приведены к числовому формату.

Этот этап позволил избавиться от шумов и ошибок, которые могли исказить результаты анализа.

Обработка данных и анализ

После очистки данных был выполнен анализ с использованием агрегирующих и статистических методов:

• расчёт средних значений; • группировка данных по уровню стресса; • анализ распределений; • исследование взаимосвязей между переменными.

На основе полученных результатов были построены графики, позволяющие визуально представить выявленные закономерности.

Использование нейросетей

В процессе работы использовался ChatGPT как вспомогательный инструмент: • для уточнения синтаксиса Pandas; • для поиска оптимальных способов агрегации данных; • для формулировки интерпретаций результатов. • для картинок reve ai.

Нейросеть применялась на этапе анализа и оформления, но не заменяла самостоятельную работу с данными.

Переход к визуализации

После завершения обработки данных были построены визуализации, которые позволяют последовательно изучить распределения показателей и перейти к объяснению взаимосвязей между сном, стрессом и продуктивностью.

Графики

Original size 1280x641

Распределение часов сна

График показывает распределение количества часов сна среди респондентов. Большинство людей спят в диапазоне 6–8 часов, однако заметная часть выборки спит меньше рекомендованной нормы, что может быть связано с повышенной утомляемостью и стрессом.

Original size 1280x660

На графике видно, что распределение уровня стресса смещено в сторону средних и высоких значений. Низкий уровень стресса встречается значительно реже, что указывает на его распространённость в повседневной жизни.

Original size 1280x703

Диаграмма рассеяния демонстрирует отрицательную связь между уровнем стресса и субъективной продуктивностью. По мере роста уровня стресса продуктивность в среднем снижается.

Original size 1280x694

График показывает, что средняя продуктивность последовательно снижается по мере увеличения уровня стресса. Этот результат подтверждает негативное влияние стресса на субъективную эффективность.

Вывод

Анализ данных показал, что высокий уровень стресса широко распространён и устойчиво связан со снижением субъективной продуктивности. Большинство респондентов испытывают средний или повышенный уровень стресса, а при его увеличении наблюдается последовательное снижение оценки собственной эффективности.

Визуализация данных позволила перейти от отдельных наблюдений к выявлению общих психологических закономерностей и наглядно показать взаимосвязь между уровнем стресса и повседневной продуктивностью.

Список источников

1. Kaggle — платформа с открытыми наборами данных Датасет: Sleep, Stress and Productivity https://www.kaggle.com 2. Pandas Documentation — документация библиотеки для анализа данных https://pandas.pydata.org/docs/ 3. Matplotlib Documentation — документация библиотеки визуализации данных https://matplotlib.org/stable/index.html 4. Stack Overflow — сообщество разработчиков, использовалось для уточнения синтаксиса и приёмов работы с данными https://stackoverflow.com 5. ChatGPT (OpenAI) — использовался для помощи в анализе данных, формулировке выводов и текстов описаний визуализаций https://chat.openai.com