модель? Мне кажется это естественно: сначала обучаем простую, остаток предсказываем сложной. Но не уверен как это тезхнически делается
А зачем в принципе использовать линейную модель когда градиентный бустинг является более гибким? Если вам нужна регуляризация для этого есть другие механизмы.
Например когда истинная зависимость линейна, а данных мало. Бустинг выучит ступенчатую зависимость, которая может оказаться хуже на валидации
Обсуждают сегодня