You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Хакатон: Битва Titанов, кейс: Система прогнозирования отказов и инцидентов на объектах железнодорожной инфраструктуры, заказчик: РЖД
Стек технологий
Python
UMAPP
CatBoost
Решение
После анализа датасета, мы выявили в нем очень большое количество признаков, не имеющих корреляцию между собой и целевой переменной.
Мы решили снизить размерность датасета с помощь технологии UMAPP, он отображает данные на n-размерном измерении. После правильного отображение можно заметить отчетливое разделение признаков
Дальше мы приступили к обучению модели, и предсказанию. Для обучения мы взяли два классификатора Catboost и SVC. В итоге Catboost дал нам больше точности, f1-score(macro) = 0.9849
График предсказаний и реальных отказов