
Вводная часть
Для этого проекта я воспользовалась сайтом Kaggle и выбрала датасет, который содержит информацию о поведении, состоянии и предпочтениях студентов на учебе и в свободное от нее время. Этот набор данных дает представление о демографических характеристиках учащихся, их успеваемости, хобби, привычках в учебе, карьерных устремлениях и других факторах для поведенческого анализа.
Общее описание данных в столбцах: - Личные данные: пол, рост, вес, финансовый статус. - Образование: сертификационные курсы, факультет, оценки (10-й класс, 12-й класс, колледж), время учебы, предпочитаемая учебная среда, удовлетворенность степенью. - Социальные аспекты: хобби, взаимодействие с соцсетями, время в пути, уровень стресса, работа с частичной занятостью. - Будущая карьера: ожидаемая зарплата, готовность продолжить карьеру.
Этот датасет позволяет изучать факторы, влияющие на эмоциональное состояние и успеваемость студентов. Будучи студенткой, я сама сталкиваюсь с вызовами этой роли, поэтому мне особенно интересно понять, как разные факторы, от учебной нагрузки до социальных взаимодействий, формируют мое психологическое благополучие.
Кроме того, этот набор данных предоставляет возможность глубже понять мотивацию, привычки и факторы, прямо или косвенно влияющие на успеваемость студентов. Я вижу у такой информации большой потенциал в направлении оптимизации учебного процесса и разработки наиболее эффективных образовательных программ. Также, на мой взгляд, особую ценность этот набор данных представляет для исследований в области психологии и ментального здоровья студентов. Понимание особенностей их существования позволит создавать более эффективные программы поддержки для предотвращения стресса и эмоционального выгорания.
Для визуализации данных я использовала следующие виды графиков:
Этапы работы

Общий алгоритм при создании графиков: 1. Импорт необходимых библиотек: matplotlib, seaborn, pandas и numpy. 2. Загрузка таблицы 'Student Attitude and Behavior.csv' с помощью 'pd.read_csv ()' в датафрейм 'df'. 3. Применение общих стилистических параметров для построения графиков, таких как семейство шрифта, размеры заголовков, подписи осей.
Для стилизации графиков были использованы шрифт и цветовые сочетания, соответственно представленные выше. Шрифт Inter я решила взять с самого сайта Kaggle при помощи инспекции элемента, посчитав, что такой гротеск будет хорошо сочетаться с большим объемом приведенных данных.
Оттенки для будущих графиков были подобраны с обложки моего проекта. Они показались мне не только достаточно разнообразными, но и «взрослеющими» — все еще яркими и мечтательными, но уже постепенно стремящимся к темноте и серьезности. В общем, иллюстрирующими студенческий путь.
Стилистические особенности:
Описанные выше характеристики я определила в начало, чтобы установить общие параметры внешнего вида для всех графиков. Это позволило обеспечить единообразие и четкость элементов графиков на всех изображениях. Помимо этого, все графики имеют заголовки и подписи осей на русском языке. Конкретные настройки для каждого из графиков будут описаны далее.
На мой взгляд, мне удалось создать выразительные графики в минималистичном стиле, без визуального шума, с использованием понятных и удобных в восприятии элементов.
Итоговые графики
1. Академическая успеваемость
Для графика о распределении студентов по академической успеваемости я создала новый столбец, объединяющий оценки за разные периоды обучения: «df['Overall_Mark'] = (df['10th Mark'] + df['12th Mark'] + df['College Mark']) / 3». Затем я разделила эти оценки на категории: «df['Performance_Level'] = pd.cut (df['Overall_Mark'], bins=[0, 60, 75, 90, 101], labels=['Отлично', 'Хорошо', 'Удовлетворительно', 'Неудовлетворительно'])». Подсчитав количество студентов в каждой категории, я использовала эти данные для создания круговой диаграммы.
График представляет процентное соотношение студентов в четырех категориях успеваемости: «Неудовлетворительно», «Удовлетворительно», «Хорошо» и «Отлично». Эти категории основаны на средней оценке студентов за 10-й класс, 12-й класс и колледж.
Параметры визуализации:
2. Антропометрические показатели
по биологическому полу
Для графика об антропометрических показателях я использовала данные из столбцов 'Height (CM)', 'Weight (KG)' и 'Gender'. Я создала диаграмму рассеяния, где каждая точка представляет студента, ее положение определяется ростом и весом человека, а цвет — полом (мужским и женским): «sns.scatterplot (x='Height (CM)', y='Weight (KG)', data=df, hue='Gender', palette=['#2DA0FF', '#FA5BDE'])».
График показывает распределение роста и веса студентов, разделенное по биологическому полу. Это позволяет визуально оценить различия в физических параметрах между полами.
Параметры визуализации:
3. Стремление построить карьеру
на основе получаемой степени
Для графика о стремлении построить карьеру на основе получаемой степени я использовала данные из столбцов 'Do You Like Your Degree? ' и 'Willingness To Pursue A Career Based On Their Degree'. Я отсортировала данные по уровню готовности построить карьеру и создала столбчатую диаграмму, показывающую распределение студентов по этим двум параметрам.
Этот график сравнивает готовность студентов построить карьеру на основе их степени (от 0% до 100%) с тем, нравится ли им их специальность. Результат позволяет увидеть, как удовлетворенность выбором специальности влияет на карьерные планы.
Параметры визуализации:
4. Предпочтения во времени учебы
Для графика о распределении студентов по предпочтениям во времени учебы я использовала данные из столбца 'Prefer To Study In'. Сначала я заменила английские значения на русские: «df['Prefer To Study In'] = df['Prefer To Study In'].replace (study_pref_labels)», где «study_pref_labels = {'Anytime': 'Любое', 'Morning': 'Утро', 'Night': 'Ночь'}». После этого я подсчитала количество студентов для каждого предпочтения и использовала эти данные для создания столбчатой диаграммы.
Предпоследний график отображает, сколько студентов предпочитает учиться утром, ночью или в любое время суток. Это дает представление о распределении учебных привычек среди студентов.
Параметры визуализации:
5. Уровни испытываемого стресса
Для графика о распределении студентов по уровню испытываемого стресса я взяла данные из столбца 'Stress Level'. Вновь я заменила английские значения на русские: «df['Stress Level'] = df['Stress Level'].replace (['Awful', 'Bad', 'Good', 'fabulous'], ['Ужасное', 'Плохое', 'Хорошее', 'Отличное'])», а затем подсчитала количество студентов для каждого уровня стресса: «stress_counts = df['Stress Level'].value_counts (sort=False)». Наконец, я отсортировала данные в нужном порядке и использовала эти значения для построения столбчатой диаграммы.
Результаты показывают распределение оценок уровня стресса среди студентов. График отображает количество студентов в следующих категориях: «Отличное», «Хорошее», «Плохое» и «Ужасное».
Параметры визуализации:
Выводы
Таким образом, анализ выбранных мной данных позволяет сделать следующие выводы:
На основании проанализированных данных можно составить следующий портрет студента:
Среднестатистический студент — это человек с умеренным уровнем стресса, который воспринимает учебу как достаточно спокойный процесс. Он не испытывает сильного давления в плане успеваемости, что может говорить о балансе между сложностью стандартной учебной программы и его собственными возможностями.
Повышенная готовность строить карьеру в выбранной области обучения говорит о том, что студент, как правило, уверен в своем выборе и видении своего будущего. Гибкость в режиме учебы и учебных привычках указывает на самостоятельность в планировании своего времени и способен адаптироваться к ситуациям.
В целом, можно предположить, что типовой студент относится к своему обучению и будущему с определенной степенью уверенности и независимости. Он способен справляться с небольшими стрессовыми ситуациями и имеет ясное представление о своих карьерных планах.
Проведенное исследование подчеркивает необходимость комплексного подхода к поддержке состояния студентов, который учитывает академические, биологические и социально-психологические аспекты их жизни.
Описание применения генеративной модели
Для создания обложки проекта я применила генератор изображений на основе искусственного интеллекта — Ideogram AI (https://ideogram.ai).
Промпт: «Bright urban street photography, conveying the essence of youth and relaxed coolness. Young students, a young man and a young woman, stand side by side, with their backs to the camera, creating an intriguing and intimate scene. A man dressed in a casual blue hoodie leans his hands on a skateboard, radiating carefree confidence. The girl is wearing a bright green oversize jacket and carries a backpack that demonstrates her practicality. The background shows a busy city street with a vintage car parked nearby and colorful graffiti decorating the walls. The atmosphere is filled with the energy of youth and a sense of carelessness, while the lively pulse of the city creates an energetic backdrop for this scene».