Статус: Проект завершен.
Данный проект состоит из двух этапов:
Этап 1: Предобработка, EDA, создание модели, способной предсказывать возможность совершения ошибки спортсменом на соревнованиях.
Этап 2: Создание двух рекомендательных систем:
- на основе базовых оценок за элемент выдает рекомендации для конкретного фигуриста. Использована библиотека Surprise.
- на основе сходства элементов (item-item based) рекомендует элементы для добавления в программу.
Python, re, pandas, sklearn, matplotlib, phik, Pipeline, RandomForest, CatBoost, Surprise.
На первом этапе обучения модели было построено 3 модели: LogisticRegression, CatBoostClassifier, RandomForestClassifier. По результатам кросс-валидации лучшей оказалась модель CatBoostClassifier с параметрами {'depth': 8, 'learning_rate': 0.1}. Ее метрика ROC-AUC на кросс-валидации равна 97%. Метрика ROC-AUC на тестовых данных равна 84.6%.
На втором этапе создано две рекомендательные системы.