- Александр Морозов
- Василий Севостьянов
- Виктория Князева
- Ильвир Хасанов
Подготовить данные для команды машинного обучения. На основе подготовленных данных будет построена модель, способная предсказать цену аренды квартиры. Отделу аналитики и оптимизации AI REA Ltd. необходимо улучшить метрику MAPE с 50% до 30%
Мы обработали данные каждой колонки, в результате чего применили изменения:
- Заполнили пустоты в значениях колонок
- Удалили колонки двух типов:
-
- колонки, данные которых не влияют на результат анализа данных;
-
- колонки, которые имеют более 75% пустых значений
-
- Сгруппированные значения некоторых колонок мы вынесли и записали в новые колонки, чтобы привести данные в числовой формат
- Сделали проверку на имеющиеся дубликаты объявлений, с последующим удалением
Файл со всеми вышеперечисленными изменениями мы записали в новый файл под названием data.csv