сводим к англ
https://util.unicode.org/UnicodeJsps/confusables.jsp?a=1&r=None
dimasik
тк контекст всего текста ру, значит и слово можем свести к ру
Может еще быть написано что-то в роде ve4erok, вот тут уже сложнее
Честно говоря, задача похожа на исправление ошибок при OCR. Может быть в эту сторону поискать? У меня когда-то был целый словарь замен для постобработки результатов FineReader...
будет здорово, если ты поделишься. лишним точно не будет
Обсуждают сегодня