решение получение структуры файла (параграфов, таблиц, рисунков и тд)?
Нашел способы получения параграфов, таблиц и тд, но хотелось бы чтобы они были собраны вместе и последовательно как в структуре файла.
Красивого решения тут априори не будет
как поставить плачущий смайлик
главное чтобы работало
хоть и не правильно
https://poi.apache.org/components/document/
Я пытался использовать это, поэтому и решил тут вопрос задать)
Docx в конце концов - это просто xml. Ты можешь читать его как хмл-ку и там то уж по тэгам получать всё, что нужно
не совсем это архив, в котором несколько xml внутри
я сознательно опустил эти детали написав “в конце концов”. это подразумевалось, короче)
Только есть очень большая проблема, на эту xml нету документации, она ой как понадобиться когда ты будешь читать не тестовый а реальный вордовский документ
документация есть, только её никто читать не будет https://gist.github.com/felipeochoa/81d8fa27901e8222c6ffbeb165a85acc
Обсуждают сегодня