распознавание есть много ошибок - где то буквы в слове не хватает, где то одно слово разбито на два (шам пунь), где то вообще хрень какая то. Есть какие то библиотеки в питоне, которые могут помочь исправить хотя бы часть этих ошибок? Поправить орфографию, там, где есть опечатки и объединить два слова в одно. Стоит ли этим вообще заниматься? Увеличит ли это точность конечной модели (в моём случаи это классификация текстов)
Я думал, уже есть подходы для исправления ошибок распознавания, которые все используют
Обсуждают сегодня