Original size 2480x3500

Портрет студента: анализ поведения, состояния и предпочтений

artificial intelligence

themes

human

health

social project

140

Вводная часть

Для этого проекта я воспользовалась сайтом Kaggle и выбрала датасет, который содержит информацию о поведении, состоянии и предпочтениях студентов на учебе и в свободное от нее время. Этот набор данных дает представление о демографических характеристиках учащихся, их успеваемости, хобби, привычках в учебе, карьерных устремлениях и других факторах для поведенческого анализа.

Общее описание данных в столбцах: - Личные данные: пол, рост, вес, финансовый статус. - Образование: сертификационные курсы, факультет, оценки (10-й класс, 12-й класс, колледж), время учебы, предпочитаемая учебная среда, удовлетворенность степенью. - Социальные аспекты: хобби, взаимодействие с соцсетями, время в пути, уровень стресса, работа с частичной занятостью. - Будущая карьера: ожидаемая зарплата, готовность продолжить карьеру.

Этот датасет позволяет изучать факторы, влияющие на эмоциональное состояние и успеваемость студентов. Будучи студенткой, я сама сталкиваюсь с вызовами этой роли, поэтому мне особенно интересно понять, как разные факторы, от учебной нагрузки до социальных взаимодействий, формируют мое психологическое благополучие.

Кроме того, этот набор данных предоставляет возможность глубже понять мотивацию, привычки и факторы, прямо или косвенно влияющие на успеваемость студентов. Я вижу у такой информации большой потенциал в направлении оптимизации учебного процесса и разработки наиболее эффективных образовательных программ. Также, на мой взгляд, особую ценность этот набор данных представляет для исследований в области психологии и ментального здоровья студентов. Понимание особенностей их существования позволит создавать более эффективные программы поддержки для предотвращения стресса и эмоционального выгорания.

Для визуализации данных я использовала следующие виды графиков:

Pie chart (круговая диаграмма) показала процентные соотношения нескольких категорий.
Scatterplot (диаграмма рассеяния) выявила взаимосвязи между переменными.
Countplot (гистограмма частот) вывела количество наблюдений для выбранных категорий.
Barplot (столбчатая диаграмма) позволила сравнивать количественные значения различных категорий. Использовалась дважды в разных визуализациях — вертикально и горизонтально.

Этапы работы

Original size 3840x436

Original size 3840x2204

Общий алгоритм при создании графиков: 1. Импорт необходимых библиотек: matplotlib, seaborn, pandas и numpy. 2. Загрузка таблицы 'Student Attitude and Behavior.csv' с помощью 'pd.read_csv ()' в датафрейм 'df'. 3. Применение общих стилистических параметров для построения графиков, таких как семейство шрифта, размеры заголовков, подписи осей.

Original size 3840x786

Original size 3840x768

Для стилизации графиков были использованы шрифт и цветовые сочетания, соответственно представленные выше. Шрифт Inter я решила взять с самого сайта Kaggle при помощи инспекции элемента, посчитав, что такой гротеск будет хорошо сочетаться с большим объемом приведенных данных.

Оттенки для будущих графиков были подобраны с обложки моего проекта. Они показались мне не только достаточно разнообразными, но и «взрослеющими» — все еще яркими и мечтательными, но уже постепенно стремящимся к темноте и серьезности. В общем, иллюстрирующими студенческий путь.

Original size 3840x924

Стилистические особенности:

Шрифт: Inter
Размер шрифта: 20
Размер заголовков: 32, жирное начертание
Отступ заголовков: 20
Размер подписей осей: 24
Отступ подписей осей: 15

Описанные выше характеристики я определила в начало, чтобы установить общие параметры внешнего вида для всех графиков. Это позволило обеспечить единообразие и четкость элементов графиков на всех изображениях. Помимо этого, все графики имеют заголовки и подписи осей на русском языке. Конкретные настройки для каждого из графиков будут описаны далее.

На мой взгляд, мне удалось создать выразительные графики в минималистичном стиле, без визуального шума, с использованием понятных и удобных в восприятии элементов.

Итоговые графики

1. Академическая успеваемость

Original size 3840x1840

Для графика о распределении студентов по академической успеваемости я создала новый столбец, объединяющий оценки за разные периоды обучения: «df['Overall_Mark'] = (df['10th Mark'] + df['12th Mark'] + df['College Mark']) / 3». Затем я разделила эти оценки на категории: «df['Performance_Level'] = pd.cut (df['Overall_Mark'], bins=[0, 60, 75, 90, 101], labels=['Отлично', 'Хорошо', 'Удовлетворительно', 'Неудовлетворительно'])». Подсчитав количество студентов в каждой категории, я использовала эти данные для создания круговой диаграммы.

График представляет процентное соотношение студентов в четырех категориях успеваемости: «Неудовлетворительно», «Удовлетворительно», «Хорошо» и «Отлично». Эти категории основаны на средней оценке студентов за 10-й класс, 12-й класс и колледж.

Original size 3840x3541

Параметры визуализации:

Тип графика: круговая диаграмма.
Цветовая палитра: ['#2DA0FF', '#FA5BDE', '#FF9950', '#01D4A9'].
Отсутствие обводки секторов.
Подписями категорий являются процентные соотношения данных.
Начальный угол: 90 градусов.

2. Антропометрические показатели
по биологическому полу

Original size 3840x2192

Для графика об антропометрических показателях я использовала данные из столбцов 'Height (CM)', 'Weight (KG)' и 'Gender'. Я создала диаграмму рассеяния, где каждая точка представляет студента, ее положение определяется ростом и весом человека, а цвет — полом (мужским и женским): «sns.scatterplot (x='Height (CM)', y='Weight (KG)', data=df, hue='Gender', palette=['#2DA0FF', '#FA5BDE'])».

График показывает распределение роста и веса студентов, разделенное по биологическому полу. Это позволяет визуально оценить различия в физических параметрах между полами.

Original size 3840x1889

Параметры визуализации:

Тип графика: точечная диаграмма рассеяния.
Цветовая палитра: ['#2DA0FF', '#FA5BDE'] (мужской и женский пол).
Белый фон с сеткой.
Ограничение значений по оси Х: показатель роста от пяти до двухсот сантиметров (так как один из опрошенных ошибочно указал значение <= 5).
Легенда с переводом на русский язык.

3. Стремление построить карьеру
на основе получаемой степени

Original size 3840x1900

Для графика о стремлении построить карьеру на основе получаемой степени я использовала данные из столбцов 'Do You Like Your Degree? ' и 'Willingness To Pursue A Career Based On Their Degree'. Я отсортировала данные по уровню готовности построить карьеру и создала столбчатую диаграмму, показывающую распределение студентов по этим двум параметрам.

Этот график сравнивает готовность студентов построить карьеру на основе их степени (от 0% до 100%) с тем, нравится ли им их специальность. Результат позволяет увидеть, как удовлетворенность выбором специальности влияет на карьерные планы.

Original size 3840x1889

Параметры визуализации:

Тип графика: групповая столбчатая диаграмма.
Цветовая палитра: ['#01D4A9', '#FA5BDE', '#2DA0FF', '#FF9950', '#FFC299'].
Белый фон с сеткой.
Отсутствие обводки столбцов.
Категории на оси X: «Не нравится» и «Нравится».
Легенда для пояснения цветов.

4. Предпочтения во времени учебы

Original size 3840x1558

Для графика о распределении студентов по предпочтениям во времени учебы я использовала данные из столбца 'Prefer To Study In'. Сначала я заменила английские значения на русские: «df['Prefer To Study In'] = df['Prefer To Study In'].replace (study_pref_labels)», где «study_pref_labels = {'Anytime': 'Любое', 'Morning': 'Утро', 'Night': 'Ночь'}». После этого я подсчитала количество студентов для каждого предпочтения и использовала эти данные для создания столбчатой диаграммы.

Предпоследний график отображает, сколько студентов предпочитает учиться утром, ночью или в любое время суток. Это дает представление о распределении учебных привычек среди студентов.

Original size 3840x1889

Параметры визуализации:

Тип графика: вертикальная столбчатая диаграмма.
Палитра: ['#FA5BDE', '#FF9950', '#2DA0FF'].
Белый фон с сеткой.

5. Уровни испытываемого стресса

Original size 3840x2108

Для графика о распределении студентов по уровню испытываемого стресса я взяла данные из столбца 'Stress Level'. Вновь я заменила английские значения на русские: «df['Stress Level'] = df['Stress Level'].replace (['Awful', 'Bad', 'Good', 'fabulous'], ['Ужасное', 'Плохое', 'Хорошее', 'Отличное'])», а затем подсчитала количество студентов для каждого уровня стресса: «stress_counts = df['Stress Level'].value_counts (sort=False)». Наконец, я отсортировала данные в нужном порядке и использовала эти значения для построения столбчатой диаграммы.

Результаты показывают распределение оценок уровня стресса среди студентов. График отображает количество студентов в следующих категориях: «Отличное», «Хорошее», «Плохое» и «Ужасное».

Original size 3840x2231

Параметры визуализации:

Тип графика: горизонтальная столбчатая диаграмма.
Цветовая палитра: ['#FA5BDE', '#2DA0FF', '#FF9950', '#01D4A9'].
Отсутствие сетки.
Подписи значений справа от каждого столбца.
Сортировка категорий: Отличное, Хорошее, Плохое, Ужасное.

Выводы

Таким образом, анализ выбранных мной данных позволяет сделать следующие выводы:

По успеваемости большинство студентов попадают в категории «Удовлетворительно» и «Хорошо», с меньшим количеством в крайних категориях («Неудовлетворительно» и «Отлично»).
Существуют значительные различия в антропометрических показателях между студентами мужского и женского пола, что может быть связано с различиями в физиологии и образе жизни. Ожидаемо, что мужчины в среднем будут выше и тяжелее женщин.
Видна положительная корреляция между удовлетворенностью выбранной специальностью и готовностью построить в ней карьеру.
Значительная часть студентов не имеет конкретных предпочтений по времени учебы. Большинство студентов предпочитают учиться «В любое время» или «Утром», с меньшим количеством предпочитающих учебу ночью.
Многие студенты оценивают свой уровень стресса как «Хороший» или «Плохой», с меньшим количеством в крайних категориях «Отличный» и «Ужасный».

На основании проанализированных данных можно составить следующий портрет студента:

Среднестатистический студент — это человек с умеренным уровнем стресса, который воспринимает учебу как достаточно спокойный процесс. Он не испытывает сильного давления в плане успеваемости, что может говорить о балансе между сложностью стандартной учебной программы и его собственными возможностями.

Повышенная готовность строить карьеру в выбранной области обучения говорит о том, что студент, как правило, уверен в своем выборе и видении своего будущего. Гибкость в режиме учебы и учебных привычках указывает на самостоятельность в планировании своего времени и способен адаптироваться к ситуациям.

В целом, можно предположить, что типовой студент относится к своему обучению и будущему с определенной степенью уверенности и независимости. Он способен справляться с небольшими стрессовыми ситуациями и имеет ясное представление о своих карьерных планах.

Проведенное исследование подчеркивает необходимость комплексного подхода к поддержке состояния студентов, который учитывает академические, биологические и социально-психологические аспекты их жизни.

Описание применения генеративной модели

Для создания обложки проекта я применила генератор изображений на основе искусственного интеллекта — Ideogram AI (https://ideogram.ai).

Промпт: «Bright urban street photography, conveying the essence of youth and relaxed coolness. Young students, a young man and a young woman, stand side by side, with their backs to the camera, creating an intriguing and intimate scene. A man dressed in a casual blue hoodie leans his hands on a skateboard, radiating carefree confidence. The girl is wearing a bright green oversize jacket and carries a backpack that demonstrates her practicality. The background shows a busy city street with a vintage car parked nearby and colorful graffiti decorating the walls. The atmosphere is filled with the energy of youth and a sense of carelessness, while the lively pulse of the city creates an energetic backdrop for this scene».

→ Датасет и код

Портрет студента: анализ поведения, состояния и предпочтений

Eva Livinskaya

artificial intelligence

140