Skip to content
This repository has been archived by the owner on Apr 10, 2023. It is now read-only.

Latest commit

 

History

History

sprint8

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 

Машинное обучение в бизнесе

Описание проекта

Допустим, вы работаете в добывающей компании «ГлавРосГосНефть». Нужно решить, где бурить новую скважину.

Вам предоставлены пробы нефти в трёх регионах: в каждом 10 000 месторождений, где измерили качество нефти и объём её запасов. Постройте модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. Проанализируйте возможную прибыль и риски техникой Bootstrap.

Инструкция по выполнению проекта

  1. Загрузите и подготовьте данные. Поясните порядок действий.
  2. Обучите и проверьте модель для каждого региона.
  3. Напишите функцию расчёта прибыли.
  4. Посчитайте риски и прибыль для каждого региона.

Описание данных

Данные геологоразведки трёх регионов находятся в файлах: geo_data_0.csv, geo_data_1.csv и geo_data_2.csv.

  • id — уникальный идентификатор месторождения;
  • f0, f1, f2 — три признака точек (неважно, что они означают, но сами признаки значимы);
  • product — объём запасов в месторождении (тыс. баррелей).

Чеклист

  • Как вы готовите данные к обучению?
  • Выполнили все шаги по инструкции?
  • Все ли условия бизнеса учтены?
  • Какие выводы об исследовании задачи делаете?
  • Корректно ли выполнена процедура Bootstrap?
  • Предложен ли регион для разработки месторождений? Обоснован ли выбор?
  • Не дублируете ли код?
  • Следите ли за структурой проекта и поддерживаете ли аккуратность кода?