
Рубрикатор
1. Введение 2. Описание проделанной работы 3. Результаты исследования 4. Выводы
Введение
Мне стало интересно, как образ жизни влияет на учебную успеваемость. Может есть какой-то секрет, который позволит мне стать «супер студентом»?
Как оказалось, я не первая, кто интересуется этим вопросом, и существует опрос 1000 студентов. В опросе отражены различные привычки студентов и их оценки за экзамен.
Однако, если я бы я решила анализировать это вручную/самостоятельно, то, во-первых, мне бы потребовалось очень много времени, во-вторых, это было бы очень сложно. Человеческий мозг не привык обрабатывать такие объекты информации.
Тут на помощь мне приходят программирование и код, которые существенно ускоряют процесс.
Итак, цель анализа данных: проанализировать взаимосвязь между привычками и оценками студентов.
Описание проделанной работы
Для проведения исследования я взяла датасет с сайта Kaggle. https://www.kaggle.com/datasets/jayaantanaath/student-habits-vs-academic-performance
В своём проекте я использовала pandas для загрузки и предобработки данных, matplotlib.pyplot для построения графиков, seaborn для их стильной визуализации и mpl_toolkits.mplot3d для 3D–построений.

Используемый код
Перед началом исследования я провела предобработку данных для удобства работы.
Используемый код
Потом приступила к построению графиков.
В ходе анализа датасета я использовала следующие виды графиков: 1. Столбчатая диаграмма (barplot) — показывает, как меняется средний итоговый балл в зависимости от качества интернета, при этом каждая полоса раскрашена по уровню рейтинга ментального здоровья. 2. Boxplot (ящик с усами) — сравнивает распределение итоговых баллов у студентов с подработкой и без подработки. 3. Диаграмма рассеяния (scatter plot) — исследует связь между процентом посещаемости занятий и итоговым баллом. 4. 3D scatter plot — визуализирует трёхмерную зависимость итогового балла от часов учёбы в день и часов сна. 5. Диаграмма рассеяния (scatter plot) — показывает, как количество часов сна влияет на итоговый балл. 6. Точечная диаграмма с линией регрессии (scatter + regression line) — иллюстрирует классическую связь «часы учёбы в день и итоговый балл» с добавленной линией тренда.
Для построения диаграмм, я решила использовать синий и зеленый цвета. Так как синий считается подходящим цветом для повышения продуктивности в процессе обучения, за счёт повышения концентрации. Зеленый цвет успокаивает, что также помогает концентрироваться.
Первое, что я решила посмотреть это то, как количество часов, потраченных на учёбу, влияет на итоговую оценку. Получалась прямая зависимость.
График зависимости итоговой оценки от часов учёбы в день
Используемый код
Затем я решила посмотреть как количество сна отражается на успеваемости студентов. Из графика следует что итоговый балл практически не имеет зависимости от времени сна, хотя у большинства студентов, получивших 100 баллов наблюдается здоровый сон (в пределах 6-8 часов).
График зависимости итоговой оценки от часов сна
Используемый код
Затем я решила исследовать два показателя вместе, чтобы получить более наглядный результат. Я посмотрела как итоговый балл за экзамен зависит от часов сна и часов, потраченных на учёбу. Получился вполне ожидаемый результат, чем больше времени студенты тратят на учёбу и сон, тем лучше их итоговые баллы.
График зависимости итоговой оценки от количества часов, потраченных на сон и на учёбу
Используемый код
Потом я посмотрела как посещаемость влияет на оценку. Как ни странно, она не играет роли вообще. Есть как студенты со сравнительно небольшой посещаемостью (70%) получившие 100 баллов, так и студенты посетившие все занятия, но при этом набравшие минимум баллов.
График зависимости итоговой оценки от посещаемости
Используемый код
Может нужно начать работать и набираться практического опыта, чтобы получать оценки выше?
Нет, график демонстрирует, что работающие и неработающие студенты в среднем показывают одинаковые результаты на экзаменах. Более того, нижний балл студентов имеющих подработку оказался выше соответствующего значения у безработных студентов.
График зависимости итоговой оценки от наличия работы
Используемый код
Далее я решила посмотреть как итоговый балл меняется в зависимости от качества интернета, и какое при этом у студентов состояние ментального здоровья.
На графике видно, что качество интернета не влияет на итоговый балл студентов, а вот уровень ментального здоровья в большинстве случаев имеет прямую линейную зависимость с итоговыми баллами за экзамен.
График зависимости итоговой оценки от качества интернета и уровня ментального здоровья
Используемый код
Результат исследования
Глядя на результаты исследования можно сделать вывод, что зависимости между привычками студентов и их оценками за экзамен практически нет. Это означает, что главное в процессе обучения — желание, всё остальное отговорки.
Вывод
Цель исследования была достигнута. Благодаря прикладному программированию я смогла быстро проанализировать большой объём информации. Программирование помогло мне сэкономить время и получить наглядный результат.