с тегами вида «вкусная еда» и «хороший сервис» я бы хотел на их основе натренировать модель классификации. Главное неудобство в том, что отдельный комментарий может иметь сразу несколько тегов (на самом деле их там куда больше двух) есть у кого соображения, какие модельки/подходы использовать?
Пока я думаю тренировать по модели для каждого тега (выходит бинарная классификация да/нет) но это, наверняка, не лучший подход
Можно перевести данные теги в эмбеддинговое пространство, и использовать их как дополнительные фичи для классификатора
Погуглите по словам Multilabel classification
Нужно классифицировать теги или они выступают как дополнительная информация?
Нужно классифицировать комментарии по тегам. Т.е. для новых комментариев определять теги «вкусная еда» «хороший сервис» и тд и тп
Спасибо!
если тегов не очень много, например, в пределах 50, то multilabel classification хорошо подойдет
Окей. Спасибо)
а с чем связано ограничение на сколько-то тегов? любопытно
Чем больше тегов, тем сложнее добиться точности от модели
Зависит от мощности
Обсуждают сегодня