
Для данного проекта я использовала базу данных с сайта Kaggle.com, с данными из приюта для животных.
Как шла работа:
1. Импорт библиотек, настройка стиля графиков (изначально выбрала один из имеющихся стилей в плот.либе) 2. Загрузка таблицы с данными 3. Предварительная обработка данных, если требовалась 4. Создание новых признаков 5. Построение графиков
Фильтрация и сортировка
Новые признаки
Создала новую категорию, определяющую возраст животного — взрослое (большое) ли оно.
Создала новый признак, переведя годы в возрасте в месяцы.
Сводные таблицы
Замена пропусков и удаление выбросов
Корреляция Пирсона
Линейная регрессия
Модель парной (простой) линейной регрессии предполагает, что значение целевого признака adopter_age можно предсказать как линейную функцию признака age_years, то есть, что изменение age_years на единицу приводит к изменению adopter_age на определённое постоянное значение, с учетом случайных ошибок.
Y = b₀ + b₁X, где Y — зависимая переменная, X — независимая переменная, b₀ — свободный член (тоже, что и точка пересечения с осью Y), а b₁ — коэффициент регрессии, показывающий изменение Y при изменении X на единиц
2. Уравнение парной линейной регрессии Общий вид уравнения:
adopter_age^ = b₀+b₁×age_years где: b₀ — свободный член (пересечение с осью Y), b₁ — коэффициент наклона (показывает, насколько в среднем изменяется adopter_age при увеличении age_years на 1)
Коэффициент детерминации R²: 0.010 Среднеквадратичная ошибка (MSE): 70.416 Средняя абсолютная ошибка (MAE): 7.152