как угодно коверкают слова, чтобы их поняли другие люди, но пропустил мат фильтр.
Например: «Дахую»
ох… Я гуглил большой список слов. Плюс городил правила. По этим правилам трансформировал текст перед прогоном по списку. Список у вас будет свой. Например «долбохлоп» - считать матом или нет, зависит от доменной области , для которой вы это все делаете. Дальше. 1. Транслит 2. Еще больший транслит jo,yo,io => ё , ио, йо 3. переделывал последовательности в варианты, типа 4=ч , 4=a , H (лат) = Н (рус), H(лат) = Х(рус), X(лат) = Х(рус) таким образом из токена получал список токенов. И каждый токен прогонял по списку мата. Было just for fun Тестилось это небольшой кучкой людей. Как батл - они против бота (меня). Там уже начинались символы юникода и иероглифы. В итоге всем надоело )) Но как идея - думаю будет полезно. В качестве ужасного примера: BLRDb ….. Все же поняли, да? ))
К сожалению, да... 😅😢
Обсуждают сегодня