предложения? Есть ли какой то предобученный sentence tokenizer или библиотека для этого?
Довольно много есть, но большинство с документацией на китайском. Наверное самый хороший от байду - BaiduLac. Но, если задача просто разбить на предложения, самым простым вариантом, наверное, будет использовать SnowNLP.
Спасибо. Просто большинство китайских библиотек почему то на слова разбиение делают, а на предложения нет
Обсуждают сегодня