достаю а простым текстом через request.body. и как я понимаю единственный вариант это бить на строки ?
Смотря какие ограничения на текст. Если гарантируется, что там <hX> разделяет на абзацы и в разметке нет подводных камней, то шутка про парсинг регулярками уже не шутка. Брать текст между </h\d> и <h\d
ну и без разницы как вы там достаёте и откуда, если вы достаёте текст в html разметке, то это html
Обсуждают сегодня