(само-собой никаких знаков препинания и близко нету). Может кто сталкивался с подобным? Как бы вы решали данную задачу?
Хм. Я бы, наверное, взял корпус текстов и посмотрел свойства слов, на которых предложения заканчиваются (через udpipe или что-нибудь в этом духе) и с которых предложения начинаются. По ним модель, дальше какой-то порог выставить для расстановки.
а WER у распознавалки у вашей какой? Просто есть подозрение, что при большом WER-е качество udpipe-ов и нейроночек будет не очень.
Обсуждают сегодня