Компании «ГлавРосГосНефть» требуется определить, где бурить новую скважину. Есть пробы нефти в 3 регионах: в каждом 10 000 месторождений, где измеряли качество нефти и объем ее запасов.
Необходимо построить модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. С мощью техники Bootstrap. следует проанализировать возможную прибыль и риски.
План работы
1) Провести предварительынй анализ данных и предобработку, если потребутеся. 2) Извлечь прищнаки и целевой признак. 3) Рзабить данные на обучающую и валидационную выборки. 4) Провести масштабирование признаков. 5) Обучить модель линейно регрессии и проверить их работу, подсчитать метрику RMSE. 6) Подсчитать точку безубыточности.
7) Техникой Bootstrap посчитать среднюю прибыль по каждому региону и определить 95% доверительный интервал для возможной прибыли и посчитать вероятность убытка.
8) На основе полученных данных определить регион, где добыча нефти принесет наибольшую прибыль.