данные содержат категориальные переменные. Подскажите, пожалуйста каким образом я должна прописать это в train? При этом мне хочется чтобы предобработка этих признаков была сделана пакетом catboost.
Удивлен, что catboost поддерживается caret , точно так?
Сама удивилась. Еще год назад не поддерживала. С численными предикторами все ок. Как передать категориальные не знаю.
как я понимаю все современные движки бустовых деревьев сейчас используют свой процессинг категориальных данных т.е. препроцессинг дополнительный не нужен, но там есть настройки, где можно что-то подкрутить: https://catboost.ai/en/docs/features/categorical-features
Спасибо. Как запустить из пакета катбуст я понимаю. Но мне по определенным причинам надо из сatboost.caret. Там caret::train(…, method=catboost.caret). На переменные типа chr вылезает ошибка. Попробую сделать их факторами. Но может сначала придется df перевести в формат мы Catboost.load_pool? Спасибо навели на мысль, с факторами работает
Если не секрет почему caret?
Большой код под разные виды моделей написан.Там еще ranger есть и внутренняя аналитика по эффективности модели, в тч по группам клиента. Если брать формат катбуста много переписывать
Обсуждают сегодня