Skip to content

Модель машинного обучения, позволяющая определить регион добычи нефти с наибольшей прибылью.

Notifications You must be signed in to change notification settings

Danspers/8.Oil-well-selection

Repository files navigation

Описание проекта

Требуется выбрать локацию новой скважины для добывающей компании «ГлавРосГосНефть»

Предоставлены пробы нефти в трёх регионах: в каждом 10 000 месторождений, где измерили качество нефти и объём её запасов. Необходимо построить модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. Проанализировать возможную прибыль и риски техникой Bootstrap.

Шаги для выбора локации:

  • В избранном регионе ищут месторождения, для каждого определяют значения признаков;
  • Строят модель и оценивают объём запасов;
  • Выбирают месторождения с самым высокими оценками значений. Количество месторождений зависит от бюджета компании и стоимости разработки одной скважины;
  • Прибыль равна суммарной прибыли отобранных месторождений.

Условия задачи:

  • Для обучения модели подходит только линейная регрессия (остальные — недостаточно предсказуемые).
  • При разведке региона исследуют 500 точек, из которых с помощью машинного обучения выбирают 200 лучших для разработки.
  • Бюджет на разработку скважин в регионе — 10 млрд рублей.
  • При нынешних ценах доход с каждой единицы продукта составляет 450 тыс. рублей, поскольку объём указан в тысячах баррелей.
  • После оценки рисков нужно оставить лишь те регионы, в которых вероятность убытков меньше 2.5%. Среди них выбирают регион с наибольшей средней прибылью.
  • Данные синтетические: детали контрактов и характеристики месторождений не разглашаются.

Общий вывод.

техникой Bootstrap были перебраны 1000 комбинаций выборок по 500 случайных скважин, из числа которых отбирались 200 лучших (по объёму предсказанных запасов) и на их примере рассчитывалась возможная прибыль. Функция расчёта прибыли описана в предыдущем разделе. Из тысячи полученных значений прибыли получилось распределение, которое изображено на графике. Для оценки возможных значений прибыли был взят 95% доверительный интервал.

Регион №1 и №3 имеют наибольший диапазон значений прибыли, часть которого лежит в зоне убытков, риск которого: 6.9% и 10.6%, соответственно. Регион №2 имеет наибольшую среднюю прибыль 419 млн.₽, и минимальную долю риска: 1.8%, что соответствует ключевому условию выбора региона, и определяет его, как единственный регион для добычи с наибольшей прибылью.

График распределения прибыли

About

Модель машинного обучения, позволяющая определить регион добычи нефти с наибольшей прибылью.

Topics

Resources

Stars

Watchers

Forks