порядков). В данных такие разбросы отсутствуют. Все значения в обучающей выборке(фичи и таргет) в диапазоне от 0 до 7000. Откуда берутся миллиарды на предсказании ? Использую catboost_spark
А на какой лосс обучали? А какие параметры обучения?
regressor = catboost_spark.CatBoostRegressor(lossFunction='RMSE', earlyStoppingRounds=16) #, iterations=10000 model = regressor.fit(train_df_split, evalDatasets=[test_df_split])
10k деревьев ничего себе. Что у вас там такое :o
я так понял там ставка на earlyStopping, но он в свою очередь не сработал из за слишком высокого трешолда
попробуйте кол-во деревьев уменьшить и earlyStopping тоже уменьшить
Там на самом деле 1000. 10 000 закомментированы
А на какой итерации он остановился? И как лосс себя ведет? Кривые обучения бы глянуть
Доходит до 999 итерации
Обсуждают сегодня