слов по правилам? Интересует выделение корня слова. Именно по правилам, не по словарю.
Пытаюсь поиграться с фильтром мата. Оказалось, что матерных слов можно напридумывать просто тонны, снабжая основную лемму приставками и суффиксами.
Или может кто-то решал уже подобные задачи?
в сколтехе есть хорошая коллекция уже с деривативами https://raw.githubusercontent.com/skoltech-nlp/rudetoxifier/main/data/train/MAT_FINAL_with_unigram_inflections.txt, а еще у них забавный бот @rudetoxifierbot
Обсуждают сегодня