задачу:
Есть модель данных с небольшим числом параметров в измерении (10-15шт) Параметры делятся условно на обязательные (которые всегда наблюдаются) и остальные - при измерении система не всегда их измеряет, но эти параметры всегда имеют какое-либо значение (имеют не нулевое значение).
Проблема в том что в реальности - система проводит измерение, и возвращает порядка 60-70% от полного набора параметров.
Проблема усугубляется тем, что в обучающей выборке, и в работе, могут приходить разные комбинации необязательных параметров (один параметр, шестой и девятый параметр, или другая комбинация из 1-3 параметров.)
_____
В целом, мне кажется логичным, для обучающей выборки - провести аугментацию данных - путем перебора известных необязательных параметров - и выделения их в отдельные измерения.
+ использовать в качестве модели какой нибудь ансамбль для обучения на неполных данных.
Что скажешь, сообщество?)
Бустинги думаю сработают без всяких аугментаций
Обсуждают сегодня