Original size 3720x5262

спать хочется, или как сон влияет на оценки

PROTECT STATUS: not protected
The project is taking part in the competition

первичный анализ dataset

1. формулирование вопроса 2. наличие данных 3. очищение или заполнение пустых строк

формулирование вопроса

Выбор темы для данной работы вызвал у меня некоторое затруднение, поэтому я решила, что самым эффективным способом для решения этой проблемы будет анализ открытых Dataset и составление главного вопроса для проекта на их основе. Так был выбран Dataset о факторах, влияющих на успеваемость студентов.

Я хотела выбрать что-то актуальное для меня сейчас и, увидев этот Dataset, я поняла, что мне было бы очень интересно разобраться насколько сон способствует ухудшению или улучшению оценок у студентов в среднем. В сессионный период эта информация является как нельзя более своевременной и волнующей.

наличие данных

big
Original size 1806x808

Я подумала, что перед полным анализом Dataset стоит обнаружить и затем убрать пустые строки.

big
Original size 1806x858
Original size 1786x112

Таким образом, ясно, что в выбранном мной Dataset 97% срок полностью заполнены и соответственно я могу без потери информативности отчистить его от строк с null.

стилизация графиков

Моя тема не основана на игре, фильме или бренде. Поэтому у нее нет определенного уже готового стиля, на который я могла бы опираться. В открытых источниках я нашла готовые шаблоны, которые можно использовать при создании графиков. Из них я выбрала «plotly_dark» тему, на мой взгляд самую выразительную и подходящую к теме. Ведь ее контраст привлекает внимание к неоднозначной актуальной для студентов теме, а сочетание темных холодных цветов создает ассоциации к позднему времени суток и сну.

Original size 1804x76

Для начала мне было интересно узнать насколько большое количество людей соблюдает правильный режим, и могу ли я отнести себя к этому списку. Мой сон часто бывает нестабильным и в среднем колеблется от 7 часов до 2. Временами бывают и выходы из этой зоны, так во время каникул это значение может превышать 9 часов, а в сессионные периоды стремится к 0.

Original size 1802x134
Original size 1784x554

Этот график является нормальным и по нему можно сделать вывод, что большинство спит в среднем по 7 часов. Свои значения я также могу наблюдать на графике, хоть и не все, видимо сон меньше 4 часов и более 10 люди стараются не допускать.

По такому же принципу я решила посмотреть на результаты экзаменов. Так как во ВШЭ у нас принята 10-ти балльная система оценивания, думаю не будет проблемой воспринимать 100 балльную систему как 100/10.

Original size 1786x136
Original size 1780x560

Так как я рассматриваю средние значения, то думаю что небольшие выбросы можно считать за артефакты и убирать их для большей ясности картинки.

Original size 1804x112
Original size 1802x158
Original size 1782x572

Далее я решила объединить оба графика, чтобы проследить за влиянием количества часов сна на качество полученной оценки.

Original size 1800x78
Original size 1780x566

Вначале я удивилась и не могла поверить в то что разница оценок между людьми, спящими по 4 часа и 10 часов, столь велика и пик достигается при наибольшем количестве часов бодрствования. Но позже я пригляделась и заметила, что разница эта совсем незначительна и колеблется между 67.3 балла и просто 67. Это заставило меня задуматься о том, как же обстоят дела глобально.

Original size 1804x82
Original size 1774x564

Данный график позволил мне понять, что сон практически не влияет на качество обучения студентов.

Данный результат не совсем удовлетворил меня и я захотела узнать, что же все-таки влияет большим образом на оценки. Меня смутил факт, что большое количество студентов, которые хорошо и отлично учатся зачастую недосыпают, и по итогу это ника не сказывается на их образовании. Поэтому я сделала такие графики для каждого из факторов, занесенных в ноутбук и хочу поделиться главными открытиями.

Original size 1776x1174

Выяснилось, что наибольшее влияние на оценки, заработанные студентами, оказывают количество часов обучения и посещение занятий. Что в полной мере объяснят ситуацию.

вывод

Таким образом, я поняла, что образование студентов и соответственно их оценки зависят от количества посещенных занятий, ведь на них непосредственно предоставляется новая информация и от времени проведенного за ураками, ведь так знания усваиваются, повторяются и заучиваются. Что касательно меня, моего опыта и того как же он соотносится со взятым мной Dataset, всё довольно просто, моя специальность (дизайнер) требует большого объема работы как креативной умственной (я сделал уточнение на слове креативной, так как на мой взгляд это играет важную роль, потому что мы не должны решить задачу по определенному алгоритму действий, точной четкой формуле, нам нужно создать, что-то исключительное, не новое, но, вдохновившись работами прошлых творцов, переработать их опыт и их работы и стелать что-то свое, без копирования, но с осознанным применением уже созданных приемов и в своем духе, в духе своего времени), так и фактической физически (в ходе создания дизайна зачастую приходится перебрать и перепробовать оромное количество вариантов) и оба этих аспекта занимают очень много времени, что подтверждает зависимость оценок от часов проведенных за работой и автоматически создает систему, образ жизни, при котором чем больше ты работаешь и меньше спишь, тем виднее и лучше результат и (хочется верить) тем выше твоя оценка (но так бывает не всегда, так как творчество зависит от куда более многих факторов, как и успеваемость студента зависит не только от выше перечисленных мной пунктов, но на это требуеся более детальный анализ).

неиросети

С неиросетью консультировалась на предмет вопросов и проблем, возникших в ходе проекта. //обложка — мой рисунок//