тем же pdfminer, в тхтшнике текст тупо плывет, особенно, если это информация табличная, как-то эту таблицу потом можно чем-то собрать в кучу? Или может есть что-то, чем это все реально вообще вытянуть?
Abbey кажется умеет таблицы распознавать
Обсуждают сегодня