Требуется выбрать локацию новой скважины для добывающей компании «ГлавРосГосНефть»
Предоставлены пробы нефти в трёх регионах: в каждом 10 000 месторождений, где измерили качество нефти и объём её запасов. Необходимо построить модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. Проанализировать возможную прибыль и риски техникой Bootstrap.
Шаги для выбора локации:
- В избранном регионе ищут месторождения, для каждого определяют значения признаков;
- Строят модель и оценивают объём запасов;
- Выбирают месторождения с самым высокими оценками значений. Количество месторождений зависит от бюджета компании и стоимости разработки одной скважины;
- Прибыль равна суммарной прибыли отобранных месторождений.
Условия задачи:
- Для обучения модели подходит только линейная регрессия (остальные — недостаточно предсказуемые).
- При разведке региона исследуют 500 точек, из которых с помощью машинного обучения выбирают 200 лучших для разработки.
- Бюджет на разработку скважин в регионе — 10 млрд рублей.
- При нынешних ценах доход с каждой единицы продукта составляет 450 тыс. рублей, поскольку объём указан в тысячах баррелей.
- После оценки рисков нужно оставить лишь те регионы, в которых вероятность убытков меньше 2.5%. Среди них выбирают регион с наибольшей средней прибылью.
- Данные синтетические: детали контрактов и характеристики месторождений не разглашаются.
техникой Bootstrap были перебраны 1000 комбинаций выборок по 500 случайных скважин, из числа которых отбирались 200 лучших (по объёму предсказанных запасов) и на их примере рассчитывалась возможная прибыль. Функция расчёта прибыли описана в предыдущем разделе. Из тысячи полученных значений прибыли получилось распределение, которое изображено на графике. Для оценки возможных значений прибыли был взят 95% доверительный интервал.
Регион №1 и №3 имеют наибольший диапазон значений прибыли, часть которого лежит в зоне убытков, риск которого: 6.9% и 10.6%, соответственно. Регион №2 имеет наибольшую среднюю прибыль 419 млн.₽, и минимальную долю риска: 1.8%, что соответствует ключевому условию выбора региона, и определяет его, как единственный регион для добычи с наибольшей прибылью.