модели https://github.com/Lesha17/Punctuation?
А то ссылка в репозитории протухла.
@psydmax @nshmyrev @sashzhu вы эту модель обсуждали, может быть, веса от неё остались?
давно было. а это не оно? https://github.com/Lesha17/Punctuation/tree/master/data
сейчас поновее есть полно моделей вроде https://github.com/sviperm/neuro-comma
Спасибо! Эта модель хороша, но она в длинный текст не вставляет точки (ну или делает это очень неохотно), а для моих целей нужно в первую очередь в длинном полотне текста находить границы предложений. Посоветуешь какую-то модель для этой задачи?
неа, но вроде как есть достаточно много хороших решений, https://github.com/sviperm/neuro-comma например
Ну я bertpunc использую. Вроде такого: https://github.com/kotikkonstantin/ru-autopunctuation тут, правда, модель не выложена. Для русского я не тренировал ещё bertpunc, хотя там быстро можно натренировать, за пару дней на одной карте. В bertpunc главное правильный слой в классификато брать, как в https://github.com/kotikkonstantin/ru-autopunctuation/blob/master/model.py#L24
а как осуществляется casing restoration в данном случае? Если в разметке только 3 класса?
Обсуждают сегодня