(engine - ranger), n = 2000, p = 5000 (почти все дамми-переменные).
Тюню модель через grid, вот код:
rf_tuning_model <-
rand_forest(trees = tune(),
min_n = tune(),
mtry = tune()) %>%
set_mode("regression") %>%
set_engine("ranger")
rf_workflow <- workflow() %>%
add_recipe(recipe_for_modelling) %>%
add_model(rf_tuning_model)
set.seed(543)
rf_tuning_folds <- vfold_cv(train, v = 10, breaks = 30)
doParallel::registerDoParallel()
set.seed(345)
tune_rf <- tune_grid(
rf_workflow,
resamples = rf_tuning_folds,
grid = 20
)
Тюнится уже часов 13 - это ок или скорее всего что-то не так?
Может не распараллелил? Вроде процессор на 90%+ используется. Есть способ как-то ускориться?
Процессор:
Intel(R) Core(TM) i5-7200U CPU @ 2.50GHz
Базовая скорость: 2,70 ГГц
Сокетов: 1
Ядра: 2
Логических процессоров: 4
Виртуализация: Отключено
Поддержка Hyper-V: Да
Кэш L1: 128 КБ
Кэш L2: 512 КБ
Кэш L3: 3,0 МБ
Использование 88%
Скорость 3,08 ГГц
Время работы 13:18:58:11
Процессы 180
Потоки 2303
Дескрипторы 82243
Попробуйте сделать поменьше сетку для перебора. =) Если я верно понимаю, то вы слишком много разбиений на фолды сделали.
Обсуждают сегодня