библиотеки которые по регулярным выражениям делят я знаю. Мне очень хочется делить на смысловые блоки абсолютно без изменения самого текста
Погуглите discourse parsing / discourse segmentation. Вероятно, это то, что Вы ищете.
Обсуждают сегодня