
первичный анализ dataset
1. формулирование вопроса 2. наличие данных 3. очищение или заполнение пустых строк
формулирование вопроса
Выбор темы для данной работы вызвал у меня некоторое затруднение, поэтому я решила, что самым эффективным способом для решения этой проблемы будет анализ открытых Dataset и составление главного вопроса для проекта на их основе. Так был выбран Dataset о факторах, влияющих на успеваемость студентов.
Я хотела выбрать что-то актуальное для меня сейчас и, увидев этот Dataset, я поняла, что мне было бы очень интересно разобраться насколько сон способствует ухудшению или улучшению оценок у студентов в среднем. В сессионный период эта информация является как нельзя более своевременной и волнующей.
наличие данных

Я подумала, что перед полным анализом Dataset стоит обнаружить и затем убрать пустые строки.

Таким образом, ясно, что в выбранном мной Dataset 97% срок полностью заполнены и соответственно я могу без потери информативности отчистить его от строк с null.
стилизация графиков
Моя тема не основана на игре, фильме или бренде. Поэтому у нее нет определенного уже готового стиля, на который я могла бы опираться. В открытых источниках я нашла готовые шаблоны, которые можно использовать при создании графиков. Из них я выбрала «plotly_dark» тему, на мой взгляд самую выразительную и подходящую к теме. Ведь ее контраст привлекает внимание к неоднозначной актуальной для студентов теме, а сочетание темных холодных цветов создает ассоциации к позднему времени суток и сну.
Для начала мне было интересно узнать насколько большое количество людей соблюдает правильный режим, и могу ли я отнести себя к этому списку. Мой сон часто бывает нестабильным и в среднем колеблется от 7 часов до 2. Временами бывают и выходы из этой зоны, так во время каникул это значение может превышать 9 часов, а в сессионные периоды стремится к 0.
Этот график является нормальным и по нему можно сделать вывод, что большинство спит в среднем по 7 часов. Свои значения я также могу наблюдать на графике, хоть и не все, видимо сон меньше 4 часов и более 10 люди стараются не допускать.
По такому же принципу я решила посмотреть на результаты экзаменов. Так как во ВШЭ у нас принята 10-ти балльная система оценивания, думаю не будет проблемой воспринимать 100 балльную систему как 100/10.
Так как я рассматриваю средние значения, то думаю что небольшие выбросы можно считать за артефакты и убирать их для большей ясности картинки.
Далее я решила объединить оба графика, чтобы проследить за влиянием количества часов сна на качество полученной оценки.
Вначале я удивилась и не могла поверить в то что разница оценок между людьми, спящими по 4 часа и 10 часов, столь велика и пик достигается при наибольшем количестве часов бодрствования. Но позже я пригляделась и заметила, что разница эта совсем незначительна и колеблется между 67.3 балла и просто 67. Это заставило меня задуматься о том, как же обстоят дела глобально.
Данный график позволил мне понять, что сон практически не влияет на качество обучения студентов.
Данный результат не совсем удовлетворил меня и я захотела узнать, что же все-таки влияет большим образом на оценки. Меня смутил факт, что большое количество студентов, которые хорошо и отлично учатся зачастую недосыпают, и по итогу это ника не сказывается на их образовании. Поэтому я сделала такие графики для каждого из факторов, занесенных в ноутбук и хочу поделиться главными открытиями.
Выяснилось, что наибольшее влияние на оценки, заработанные студентами, оказывают количество часов обучения и посещение занятий. Что в полной мере объяснят ситуацию.
вывод
Таким образом, я поняла, что образование студентов и соответственно их оценки зависят от количества посещенных занятий, ведь на них непосредственно предоставляется новая информация и от времени проведенного за ураками, ведь так знания усваиваются, повторяются и заучиваются. Что касательно меня, моего опыта и того как же он соотносится со взятым мной Dataset, всё довольно просто, моя специальность (дизайнер) требует большого объема работы как креативной умственной (я сделал уточнение на слове креативной, так как на мой взгляд это играет важную роль, потому что мы не должны решить задачу по определенному алгоритму действий, точной четкой формуле, нам нужно создать, что-то исключительное, не новое, но, вдохновившись работами прошлых творцов, переработать их опыт и их работы и стелать что-то свое, без копирования, но с осознанным применением уже созданных приемов и в своем духе, в духе своего времени), так и фактической физически (в ходе создания дизайна зачастую приходится перебрать и перепробовать оромное количество вариантов) и оба этих аспекта занимают очень много времени, что подтверждает зависимость оценок от часов проведенных за работой и автоматически создает систему, образ жизни, при котором чем больше ты работаешь и меньше спишь, тем виднее и лучше результат и (хочется верить) тем выше твоя оценка (но так бывает не всегда, так как творчество зависит от куда более многих факторов, как и успеваемость студента зависит не только от выше перечисленных мной пунктов, но на это требуеся более детальный анализ).
неиросети
С неиросетью консультировалась на предмет вопросов и проблем, возникших в ходе проекта. //обложка — мой рисунок//