Рисунок разве связан с данными? Обучить модель надо только по табличным данным или как? Можно озвучить всю задачу?
полный текст задания
В реальной жизни для изучения свойств целевого пласта на месторождении бурятся скважины, после чего в них опускаются специальные устройства - каротажные зонды. С их помощью проводится запись различных геофизических полей (например, радиоактивность или плотность), создаваемых горными породами. Подобные исследования называются геофизическими исследования скважин - ГИС. На основе полученных данных специалисты петрофизики проводят интерпретацию и сообщают информацию о том, на какой глубине находится пласт-коллектор, который может накапливать и отдавать флюиды. Типичный пример различных каротажных кривых и их совместной интерпретации представлен на рисунке ниже:
PIC
На основе полученной интерпретации можно посчитать такое свойство как песчанистость в зоне бурения скважины. Песчанистость — это отношение толщин пластов-коллекторов к общей толщине геологического образования, данная характеристика позволяет геологам делать предположения об экономической эффективности работы с этим месторождением. К сожалению, бурение скважин является очень дорогостоящей операцией, поэтому мы используем различные алгоритмы картопостроения с целью прогноза свойств в межскважинном пространстве. В качестве данных в представленной задаче используется информация из синтетической модели месторождения, которая была построена на основе геологического обнажения Шестаково, Кемеровская область. По его описанию были определены различные геологические параметры (размеры и геометрия тел, их связанность и значение песчанистости), которые в дальнейшем использовались при построении 3D модели. Подобный подход позволил достаточно точно отобразить реальную геологию (которая обычно не доступна для визуального анализа) и использовать полученный результат в качестве полигона для опробования и оценки различных подходов.
PIC
В предоставленном наборе данных имеется информация о 10% скважинных данных (в реальной жизни их может быть менее 1% от площади месторождения!), используя которые, Вам предлагается построить алгоритм, который бы предсказывал значения песчанистости в точках с отсутствующими значениями.
Вход: тренировочный датасет (Training wells.csv) с заполненными значениями песчанистости, а также тестовый датасет (Empty part.csv) с пропущенными значениями песчанистости, для которого вы должны предсказать эти значения.
Выход: файл с предсказанием песчанитости для тестового файла. В выходном файле последовательность строк сохранить, само предсказание песчанистости добавить четвёртым столбцом в датасет с заголовком столбца NTG, как это сделано в тренировочном датасете. Получившийся файл загрузить в систему.
Критерии оценивания: в качестве метрики оценивания используется метрика RMSE, участники ранжируются относительно значения этой метрики (от меньшего к большему).