сгруппировать однокоренные слова?
stringdist - там много вариантов для определения расстояния между строками в вашем конкретном случае подошло бы lcs -определение расстояния на основе наиболее длинной общей подстроки
спасибо. буду изучать
попробуйте лемматизацию в udpipe, там есть модель для русского языка, очень даже неплохо работает.
можно юзать https://yandex.ru/dev/mystem/, примеры тут в чате я кидал
у майстем могут был ограничения лицензии в целом udpipe мне показался очень хорошим
ну я бы не сказал, что сильно серьезные ограничения https://yandex.ru/legal/mystem/
если я буду ее использовать в своем геймдеве, то рискую попасть под пункт "не создавать сервисы аналогичные сервисам правообладателя" :)
а, ну теперь понял :)
Обсуждают сегодня