а не их значения? Или хотя бы такие библиотеки регулярных выражений, в которых можно задавать свои наборы значений.
Например я хочу детектить мат и добавляю в фильтр слово "пидарас", любой сможет обойти этот фильтр заменив русские буквы на те же знаки закодированные другим языком, например английским. Например заменят буквы а и с. Я бы хотел составить регулярку, которая будет матчить не код символов, а их представление. Не обязательно на питоне
А как будешь детектить пидора, пидораза или педораса?
нет, но недавно пролетала подобная регулярка на 15кб, видно, что ее чем-то сгенерировали https://www.debuggex.com/r/IOsKXuLCvQUSZUr9
Хороший пример того что нет, это нельзя сделать это никнеймы в battle net близзардов. Буквально на днях играл с челом с ником "стараяблѧдь"
Но если у кого-нибудь есть информация - пишите
Какие кейсы, кроме мата еще нужны?
Для случая с матом, кажется, что библиотека не нужна. Просто составляешь словарик, где ключ - русская буква, а значение - спосок представлений этой буквы. Функция просто сшивает все элементы списка с | и все, только надо экранировать все символы потом для каждой буквы своя регулярка получается. Проблемы будут только в ситуации, когда несколько символов будут означать несколько русских символов
Обсуждают сегодня