вогнал.
Задача линейной регрессии.
Собрал датасет, разделил его на трейн и тест.
Стандаризировал числовые признаки через sklearn.StandardScaler().
Обучил модель, валидировал на тестовой выборке - все устроило.
Вопрос в следующем: вот сейчас мне нужно сделать прогноз для одного, НОВОГО наблюдения. Как мне стандартизировать признаки в нем? Засунуть его в начальный train датасет и сделать стандартизацию там? Как правильно?
Через применение я полагаю, Scal.transform(X)
Да как ты мог задать этот вопрос!?!?!?!?!?!?!?
Вам нужно сохранить параметры стандартизации, рассчитанные на трейне, а потом применить их в стандартизации к этому наблюдению. Например, в R это делается в пару строк в пакете recipes.
Обсуждают сегодня