nrounds = 100,
max_depth = 6,
eta = 0.3,
gamma = 0,
colsample_bytree = 1,
min_child_weight = 1,
subsample = 1
)
train_control <- caret::trainControl(
method = "none",
verboseIter = FALSE, # no training log
allowParallel = TRUE # FALSE for reproducible results
)
xgb_base <- caret::train(
x = training_data_matrix[trainIndex,],
y = train_clean_price$SalePrice[trainIndex],
trControl = train_control,
tuneGrid = grid_default,
method = "xgbTree",
verbose = TRUE
)
training_data_matrix 1168 строк и 80 столбцов
1) Получается, что R не знает, когда он закончит работать с этим кодом?
Дело в том, что я думала есть tune_grid и R знает, сколько в этом data.frame строк и столбцов.
2) Каким образом планировать, сколько времени будет занимать построение той или иной модели? Очень маленький опыт показывает, что это занимает около часа.
3) Ведь в R же нельзя параллельно несколько процессов запустить?
Я прошу прощения, если мои вопросы неправильно поставлены или кажуся глупым. Просто хочется знать, хотя бы +/- 15 минут, сколько ждать
Параллельно можно. Если они независимы, то вообще без проблем. Хоть ещё одну сессию открываете, даже можно не заморачиваться.
Обсуждают сегодня