Задание: необходимо выполнить прогнозирование цен на бриллианты с помощью методов машинного обучения
Прогнозирование цен на бриллианты может помочь людям в следующих целях:
• разработка стратегий закупки и продажи бриллиантов: прогнозирование цен на бриллианты может помочь фирме разработать более эффективные стратегии закупки и продажи бриллиантов, заранее предугадывая изменения цен на рынке;
• определение цен на новые модели бриллиантов: прогнозирование цен на бриллианты может помочь производителям бриллиантов предсказать, как цены на их новые модели будут восприниматься на рынке и какие будут их конкурентные преимущества;
• конкурентный анализ: прогнозирование цен на бриллианты может помочь фирмам провести анализ конкурентов, чтобы понимать их стратегии и возможный рыночный потенциал;
• управление рисками и инвестициями: прогнозирование цен на бриллианты может помочь инвесторам принимать более обоснованные решения в отношении покупки и продажи бриллиантов в целях управления рисками и увеличения прибыли.
Ожидаемые преимущества: рост прибыли на 7% в среднесрочной перспективе, а также увеличение доходности инвестиций
Критерий успеха: рост рентабельности продаж
Для успешной реализации проекта необходимы следующие категории специалистов: аналитик данных, бизнес-аналитик, специалист по базам данных, руководитель проекта. Заказчик располагает всем необходимым оборудованием для поведения анализа данных
Риски:
- Несоблюдение сроков проекта
- Риск неплатежеспособности заказчика
- Риск нехватки и неполноты данных
- Риск несоответствия полученных результатов требованиям заказчика.
Ограничение сроков: 6 месяцев.
Ставки по сотрудникам:
Аналитик данных – 1 ставка.
Бизнес-аналитик – 1 ставка.
Также ограничением является сложность в изучении предметной области (ювелирного дела), на это требуется немало времени.
Цели исследования данных:
• построение визуализации рентабельности продаж товаров, характеристик потребителей, недельные колебания продаж, сравнительного анализа поставщиков, аналитики каналов сбыта;
• решение задачи прогнозирования продаж, выручки, прибыли с использованием моделей регрессии. В качестве моделей предполагается использование модели линейной регрессии, ближайшего соседа, деревьев решений, случайного леса.
Метрики оценки точности и качества построенных моделей:
Качество модели определяется с использованием коэффициента детерминации (R2), точность модели определяется на основании средней относительной ошибки (MAPE).
Границы значений метрик: R2 должен быть больше либо равен 0.8, MAPE не более 10%.