169 похожих чатов

In the new Release it says that Text Features

are now supported in the R Version. But the load_pool function has no mention of Text Features. How can Text Features be used then ? Are there any Plans to include embeddings Features in the R Version too ?

2 ответов

127 просмотров

Hello! Currently, one can use text features only when providing dataset in data.frame. All columns that contain character values (not factors!) are considered as text columns. Simple example of such usage: dfTrain <- data.frame(height=c(150,120, 30),weight=c(200, 220, 150), phrase=c('hello good I am good I hello good', 'good I hello I am good hello','bad bad bad bad'), eye=c(2,1,15), y_train=c(0, 0, 1)) dfTrainx<- dfTrain[,!(names(dfTrain) %in% c('y_train'))] labels<-dfTrain[,c('y_train')] pool <- catboost.load_pool(data=dfTrainx, label=labels) params <- list( loss_function= 'Logloss', iterations = 100 ) model <- catboost.train(pool, params=params) One more thing to mention: If texts in your dataset are too small, you can face the following error: catboost/private/libs/feature_estimator/text_feature_estimators.cpp:89: Dictionary size is 0, check out data or try to decrease occurrence_lower_bound parameter This means that too few word combinations(n-grams) have been found. By default, occurence_lower_bound is 3, so you should have at least 3 repetitions for some 2-word ngram. Unfortunately, changing this parameter is not yet supported

Thomas-Wolf Автор вопроса

Thanks for the Info. That's actually quite user friendly, especially easy to use with R ML packages i.e mlr3

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта