Буквально среднее число от всей выборки
Понял, улучшить не помешает видимо. Применение 3 уровневого скалирования перебор? Логарифмическое, Box-cox, векторное? Box-cox или общее преобразование Преобразованиеv Йео-Джонсона, не вычисляется из-за длинных значений в признаках, поэтому требуется логарифмическое преобразование. А векторное, даёт хороший результат по другим метрикам, таким как RMSE, MAE, MSE. А их общая комбинация улучшит коэффициент детерминации
Зачем вообще задавать вопрос в такой постановке? "Перебор" наступит тогда, когда вы сами посчитаете дальнейшие попытки экономически нецелесообразными.
Стойте а как так вышло, что rmse падает, а R^2 растет
Между фолдами? Да там же в пределах погрешности вроде.
Разве? Только при смены модели такое может быть, когда одни показатели улучшились, а другие ухудшились. Но проблема в том, в не зависимости от объёма данных, хоть 3 мб, хоть гб, качество не меняется.
Обсуждают сегодня