169 похожих чатов

In the new Release it says that Text Features

are now supported in the R Version. But the load_pool function has no mention of Text Features. How can Text Features be used then ? Are there any Plans to include embeddings Features in the R Version too ?

2 ответов

115 просмотров

Hello! Currently, one can use text features only when providing dataset in data.frame. All columns that contain character values (not factors!) are considered as text columns. Simple example of such usage: dfTrain <- data.frame(height=c(150,120, 30),weight=c(200, 220, 150), phrase=c('hello good I am good I hello good', 'good I hello I am good hello','bad bad bad bad'), eye=c(2,1,15), y_train=c(0, 0, 1)) dfTrainx<- dfTrain[,!(names(dfTrain) %in% c('y_train'))] labels<-dfTrain[,c('y_train')] pool <- catboost.load_pool(data=dfTrainx, label=labels) params <- list( loss_function= 'Logloss', iterations = 100 ) model <- catboost.train(pool, params=params) One more thing to mention: If texts in your dataset are too small, you can face the following error: catboost/private/libs/feature_estimator/text_feature_estimators.cpp:89: Dictionary size is 0, check out data or try to decrease occurrence_lower_bound parameter This means that too few word combinations(n-grams) have been found. By default, occurence_lower_bound is 3, so you should have at least 3 repetitions for some 2-word ngram. Unfortunately, changing this parameter is not yet supported

Thomas-Wolf Автор вопроса

Thanks for the Info. That's actually quite user friendly, especially easy to use with R ML packages i.e mlr3

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Ну вот просто даже давайте вот как. Какой нибудь конкретный кейс, можете в пример привести, где бч работает и приносит прикладную пользу, а не просто что бы было? Не крипту.
Alexander Andreev
22
объясните пожалуйста, почему функция не работает должным образом? вроде должно брать активное окно сравнивать его размер с размером экрана, и если есть совпадение = true прове...
JF
12
> Копаем глубже > Следующий момент был, когда я спросил его, знает ли он JavaScript. Он ответил, что его учили работать с C#. Я тоже в университете писал на C#, но даже там мн...
Oleg Volkov
4
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Народ! Впервые клиенту пришло письмо от РКН, у вас, дескать, есть яндекс метрика, а нигде не написано, что вы ее юзаете. Никто не сталкивался?
Sasha Beep
14
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
8
Вопрос на перед, на следующую пятницу. Сколько строк кода можно вешать на одного программиста, понятно что если проект хорошо написан то можно и миллион. Но есть же где то пре...
AlekseyK Kluchnikov
31
Карта сайта